阿里云-云小站(无限量代金券发放中)
【腾讯云】云服务器、云数据库、COS、CDN、短信等热卖云产品特惠抢购

MySQL冗余和重复索引

149次阅读
没有评论

共计 1507 个字符,预计需要花费 4 分钟才能阅读完成。

MySQL 允许在相同列上创建多个索引,无论是有意还是无意,mysql 需要单独维护重复的索引,并且优化器在优化查询的时候也需要逐个地进行考虑,这会影响性能。

重复索引是指的在相同的列上按照相同的顺序创建的相同类型的索引,应该避免这样创建重复索引,发现以后也应该立即删除。但,在相同的列上创建不同类型的索引来满足不同的查询需求是可以的。

CREATE TABLE test(
  ID INT NOT NULL PRIMARY KEY,
  A INT NOT NULL,
  B INT NOT NULL,
  UNIQUE(ID),
  INDEX(ID),
) ENGINE=InnoDB;

这段 SQL 创建了 3 个重复索引。通常并没有理由这么做。

冗余索引和重复索引有一些不同,如果创建了索引(a,b),再创建索引(a)就是冗余索引,因为这只是前面一个索引的前缀索引,因此(a,b)也可以当作 (a) 来使用,但是(b,a)就不是冗余索引,索引 (b) 也不是,因为 b 不是索引(a,b)的最左前缀列,另外,其他不同类型的索引在相同列上创建(如哈希索引和全文索引)不会是 B -Tree 索引的冗余索引,而无论覆盖的索引列是什么。

冗余索引通常发生再为表添加新索引的时候。例如,有人可能会增加一个新的索引 (A,B) 而不是扩展以后的索引(A)。还有一种情况是将一个索引扩展为(A,ID), 其中 ID 是主键,对于 InnoDB 来说主键已经包含在二级索引中了,所以这也是冗余的。

大多数情况下都不需要冗余索引,应该尽量扩展已有的索引而不是创建新索引,但也有时候处于性能方面的考虑需要冗余索引,因为扩展已有的索引会导致其变得太大,从而影响其他使用该索引的查询性能。如:如果在整数列上有一个索引,现在需要额外增加一个很长的 varchar 列来扩展该索引,那么性可能会急剧下降,特别是有查询把这个索引当作覆盖索引,或者这是 myisam 表并且有很多范围查询的时候(由于 myisam 的前缀压缩)

比如,有一张 userinfo 表。这个表有 1000000 条数据,对每个 state_id 值大概有 20000 条记录。在 state_id 有一个索引,那么下面的 SQL 我们称之为 Q1

SELECT count(*) FROM userinfo WHERE state_id=5; –Q1

改查询的执行速度大概是每秒 115 次(QPS)

还有一个 SQL,我们称之为 Q2

SELECT state_id,city,address FROM userinfo WHERE state_id=5; –Q2

这个查询的 QPS 是 10,提升该索引性能最简单的办法就是狂战索引为(state_id,city,address),让索引能覆盖查询:

ALERT TABLE userinfo ADD KEY state_id_2(state_id,city,address);

(注:state_id 已经有索引了,根据前面的概念,这是一个冗余索引而不是重复索引)

怎么找出冗余索引和重复索引呢?

1. 可以使用 Shlomi Noach 的 common_schema 中的一些试图来定位,common_schema 是一系列可以安装到服务器上的常用的存储和试图。

2. 可以使用 Percona Toolkit 中的 pt_duplicate-key-checker, 该工具通过分析表结构来找出冗余和重复的索引。

参考文献:

 [1] Baron Schwartz 等 著,宁海元等 译;《高性能 MySQL》(第 3 版);电子工业出版社,2013

高性能 MySQL(第 3 版)中文 PDF 带目录清晰版 下载  http://www.linuxidc.com/Linux/2014-10/108464.htm

 

正文完
星哥说事-微信公众号
post-qrcode
 0
星锅
版权声明:本站原创文章,由 星锅 于2022-01-22发表,共计1507字。
转载说明:除特殊说明外本站文章皆由CC-4.0协议发布,转载请注明出处。
【腾讯云】推广者专属福利,新客户无门槛领取总价值高达2860元代金券,每种代金券限量500张,先到先得。
阿里云-最新活动爆款每日限量供应
评论(没有评论)
验证码
【腾讯云】云服务器、云数据库、COS、CDN、短信等云产品特惠热卖中