以下的文章主要是对SQL Server索引的有效性(Evaluating Index Usefulness)的评价,我们大家都知道SQL Server数据库提供索引主要的原因有两个:其一是作为一种保证数据库表中数据唯一性的 *** 。
其二,提供了一种快速访问表中数据的 *** 。创建合适的索引是数据库物理设计时最为重要的方面之一。因为你不能在一个表上无限制地创建SQL Server索引,而且不管怎么说,它也是不可行的。所以,你将想在一些具有高选择性 (high Selectivity )的列上创建索引,这样,查询时系统将会利用这些索引。一个索引的选择性定义如下:
引用
选择率 = (唯一索引值的个数)/ (表中所有行数)
Selectivity ratio = (Number of unique index values)/ (Total number of rows in the
假如选择率高——也就是说,大量行都可以用索引键值来唯一标识——那么该索引就具有高选择性,即对优化器来说也是有用的。更佳的选择性是1,即每一行都有一个唯一的索引键值。低选择性意味着表中有许多重复的键值,这样的SQL Server索引将很少有用。SQL Server优化器基于索引的选择性来决定对一个查询是否使用索引。越高的选择性,SQL Server检索结果集(Result set)就越快和越有效。
例如,你正在对authors 表中的索引的有效性进行评估。假如大多数查询是以author's last name或者state来进行访问的。因为大量的并发用户会修改该表的数据,你只允许一个索引——author's last name或者state,你将会选择谁?让我们进行一些分析来判断哪个索引更有效些,或者更有选择性。首先,利用一个查询来确定pubs数据库中 author表的last name列的有效性:
Sql代码
select count(distinct au_lname) as '# unique', count(*) as '# rows', str(count(distinct au_lname) / cast (count(*) as real),4,2) as 'selectivity' from authors go select count(distinct au_lname) as '# unique', count(*) as '# rows', str(count(distinct au_lname) / cast (count(*) as real),4,2) as 'selectivity' from authors go # unique # rows selectivity 22 23 0.96
author表的au_lname列的有效率计算值为0.96,表明在au_lname创建的SQL Server索引将具有高选择性,也是一个好的候选索引。除了一行外,其余所有行的last name值都唯一。 现在,来分析state列的选择性:
Sql代码 select count(distinct state) as '# unique', count(*) '# rows', str(count(distinct state) / cast (count(*) as real),4,2) as 'selectivity' from authors go select count(distinct state) as '# unique', count(*) '# rows', str(count(distinct state) / cast (count(*) as real),4,2) as 'selectivity' from authors go # unique # rows selectivity 8 23 0.35
正如你所看到的,state列的SQL Server索引选择率(0.35)比au_lname索引选择率要低很多,将不太有用。
对于这一点,你可能会问,是否因为state列中的一些值具有较高的重复性而导致了选择性的下降,或者说仅仅只有一些值具有唯一性。你可以用下面的查询来确定
Sql代码 select state, count(*) from authors group by state order by 2 desc go select state, count(*) from authors group by state order by 2 desc go state CA 15 UT 2 TN 1 MI 1 OR 1 IN 1 KS 1 MD 1
正如你所预料到的,state值,除了一个外,其余值都相对唯一。因为表中有多一半的state值都为‘CA’。所以state可能不是一个好的候选索引列,特别是假如大部分时间你都以CA来进行查询,此时,SQL Server将发现扫描整个表将比借助索引进行查询数据更有效。
一般来说,假如一个键值的选择率低于0.85,那么优化器通常会选择表扫描来处理查询。在这种情况下,使用表扫描来获取所有满足条件的数据行将比通过B-Tree来定位大量数据行来查找更有效率。
假如有更多的索引可以选择,那么SQL Server将怎样来确定每个索引是否具有选择性和到底选择哪一个索引对用户来说更有效呢?例如,SQL Server怎么知道下面的索引能够返回多少行?
select * from table where key between 1000000 and 2000000
假如该表在0到20,000,000之间有10,000,000行记录,优化器如何知道是使用一个SQL Server索引还是进行表扫描呢?假如在该范围内有10行记录,或者900,000,又如何选择?SQL Server如何来估计在1,000,000 至2,000,000之间有多少行?等等诸如此类的问题,优化器是从索引统计(Index Statistics)中获得这些信息的。
扫描二维码推送至手机访问。
版权声明:本文由2345好导航站长资讯发布,如需转载请注明出处。
对于Windows 7系统来说,其默认安装的许多工具是我们很少使用或从来不用的,比如系统自带的扫雷、纸牌游戏等。删除此类长期不用的系统组件,不但可以让系统更清爽,更重要的是还可以提高系统的运行速度,特别是对于硬件配置相对较低的上网本来说,尤其如此。接下来,笔者就给大家介绍一下如何删除Windows...
我一个朋友最近装装了Windows 7,他总感觉有人用了他的电脑,但是一直不确定,他想知道有没有人动用他的电脑,问我有没有办法 我说设置一下就行了: 启动Windows 7,在搜索栏中输入编辑组,马上就搜索到了编辑组策略,点击即可启动程序编辑组策略。依次展开组策略左侧树形列表的计算机配置/管理模...
北京时间1月13日消息,根据计划,微软将于2015年1月13日正式结束对Windows 7SP1的“主流支持”,而这也标志着“扩展支持”阶段的开始,这个阶段将于2020年1月14日结束。 2013年10月份,微软终止销售独立的Windows 7系统安装包,并要求制造商于2014年10月份停止生...
出现该问题的原因是由于使用第三方优化软件消除快捷方式的小箭头引起的。 1、在开始搜索框中键入“regedit”,按回车键打开注册表编辑器。 2、依次定位到以下分支:HKEY_CLASSES_ROOTlnkfile。 3、在lnkfile项上鼠标右键单击“新建”——“字符串值”。...
当我在虚拟机的linux系统中ping本机的ip发现ping不通,而本机可以ping通虚拟机中的ip。应该是出于安全考虑吧,Windows 7默认在防火墙里禁止了。 1、查看主机ip 打开“开始”程序中的“附件”,找到“命令提示符”打开。输入命令:ipconfig,可以看到本机的ip是192.1...
一、打开控制面板,选择“网络和共享中心”; 二、在网络和共享中心中选择“设置新的连接或网络”; 三、选择连接到Internet; 四、选择“仍要设置新的连接”; 五、选择“宽带PPPoE ”; 六、输入对应的宽带帐号及密码,点击连接即可;...