索引可以提高数据的访问速度,但创建索引的同时也增加了插入、更新和删除操作的处理时间,增加了物理磁盘的存储空间。所以是否要为数据表增加索引,为数据表中哪些字段增加索引,是创建索引前必须要考虑的问题。下面作者就为数据库表创建索引的一些原则和方法和大家做一些分享。
一. 索引是建立在数据库表中的某些列上面的。因此,在创建索引的时候,应该仔细考虑在哪些列上可以创建索引,在哪些列上不能创建索引。
具有下面几点情况的数据列是比较适合建立索引的:
1. primary key 字段, 系统自动创建主键的索引;
2. unique kye 字段,系统自动创建对应的索引;
3. foreign key 约束所定义的作为外键的字段;
4. 在查询中用来连接表的字段;
5. 经常进行 order by、group by、distinct 的字段;
6. 经常使用在 Where 子句中的列的字段;
7. 经常需要根据范围进行搜索的字段;
8. 在经常存取的多个列上建立复合索引,但要注意复合索引的建立顺序要按照使用的频度来确定;
具有下面这些特点的列则不适宜创建索引:
1. 对于那些在查询中很少使用或者参考的列不应该创建索引。这是因为,既然这些列很少使用到,因此有索引或者无索引,并不能提高查询速度。相反,由于增加了索引,反而降低了系统的维护速度和增大了空间需求;
2. 不要在有大量相同取值的字段上,建立索引。这是因为,由于这些列的取值很少,例如一篇文章表里面的是否推荐,在查询的结果中,结果集的数据行占了表中数据行的很大比例,即需要在表中搜索的数据行的比例很大。增加这样的字段索引,并不能明显加快检索速度;
3. 对于那些定义为text, image和bit数据类型的列不应该增加索引。这是因为,这些列的数据量是不定长的,数据结果要么相当大,要么取值很少;
4. 当修改性能远远大于检索性能时,不应该创建索引。这是因为,修改性能和检索性能是互相矛盾的。当增加索引时,会提高检索性能,但是会降低修改性能。当减少索引时,会提高修改性能,降低检索性能。因此,当修改性能远远大于检索性能时,不应该创建过多的索引。
二. 索引会占用磁盘空间,创建不必要的索引只会形成浪费。具体如何创建索引还得根据实际业务情况来定夺。
1. 对于内容很少更新却需要经常被查询的数据表,为它多创建几个索引無所谓;
2. 对于需要经常性更新的表而言,则需要谨慎地创建确实必要的索引。对一个存在大量更新操作的表,所建索引的数目一般不要超过3个,最多不要超过5个。索引虽说提高了访问速度,但太多索引会影响数据的更新操作;
3. 经常性的检查数据表结构,删除不再使用,或者很少被使用的索引。表中的数据被大量更新,或者数据的使用方式被改变后,原有的一些索引可能不再被需要。数据库管理员应当定期找出这些索引,将它们删除,从而减少索引对更新操作的影响。
4. 对复合索引,按照字段在查询条件中出现的频度建立索引。在复合索引中,记录首先按照第一个字段排序。对于在第一个字段上取值相同的记录,系统再按照第二个字段的取值排序,以此类推。因此只有复合索引的第一个字段出现在查询条件中,该索引才可能被使用。因此将应用频度高的字段,放置在复合索引的前面,会使系统最大可能地使用此索引,发挥索引的作用。
5. 对于小型的表,建立索引可能会影响性能。