MySQL如何优化索引

发布于:2024-04-22 ⋅ 阅读:(78) ⋅ 点赞:(0)

目录

前缀索引优化

覆盖索引优化

主键索引最好是自增的

索引最好设置为 NOT NULL

防止索引失效


前缀索引优化

假设你有一个users表,其中有一个email字段(VARCHAR(255))。

为了加速基于email的查询,但又不希望因为完整的email字段而消耗过多索引空间,

因为索引页是有限的空间,而一个索引页包含的内容越多,一次性查找的内容就越多,

同时还可以减少数据库的IO

你可以创建一个前缀索引:

CREATE INDEX idx_email_prefix ON users(email(10));

这条语句就创建了长度为10的email的索引

覆盖索引优化

假设你有一个products表,包含product_id、product_name和price字段。

你经常查询某个产品的价格,并且只想从索引中获取数据,而不是访问实际的表数据(全部数据)。

那么我们如何在查询二级索引的获得数据的同时,避免回表

我们可以建立一个联合索引,即「product_id、price」作为一个联合索引。

如果索引中存在这些数据,查询将不会再次检索主键索引,从而避免回表。

CREATE INDEX idx_product_price ON products(product_id, price);

什么是二级索引:非主键索引

什么是回表:使用二级索引找不到我们需要的内容时,再使用主键索引查找内容,从而导致大量的IO

进而使MySQL查询变慢

主键索引最好是自增的

我们都知道InnoDB 创建主键索引默认为聚簇索引,数据被存放在了 B+Tree 的叶子节点上。

同一个叶子节点内的各个数据是按主键顺序存放的,每当有一条新的数据插入时,

数据库会根据主键将其插入到对应的叶子节点中。

如果我们使用自增主键,那么每次插入的新数据就会按顺序添加到当前索引节点的位置,不需要移动已有的数据,当页面写满,就会自动开辟一个新页面。因为每次插入一条新记录,都是追加操作,不需要重新移动数据,因此这种插入数据的方法效率非常高。

如果我们使用非自增主键,由于每次插入主键的索引值都是随机的,因此每次插入新的数据时,就可能会插入到现有数据页中间的某个位置,这将不得不移动其它数据来满足新数据的插入,甚至需要从一个页面复制数据到另外一个页面,我们通常将这种情况称为页分裂。页分裂还有可能会造成大量的内存碎片,导致索引结构不紧凑,从而影响查询效率

索引最好设置为 NOT NULL

我们设置索引肯定是希望利用它,能加快搜索速度,那么为什么要设置为非空呢?

1.NULL本来就是没有意义的值,在c++里面就是为0,那么没有意义的东西,

为什么要让它白白占宝贵内存呢

2.我们设置为空,那么优化器在做索引选择的时候更加复杂,更加难以优化,因为我们需要

多判断一个索引是否为空比如进行索引统计时,count 会省略值为NULL 的行。

防止索引失效

当我们使用左或者左右模糊匹配的时候,也就是 like %xx 或者 like %xx%这两种方式都会造成索引失效;

为什么呢?索引是由索引值从左到右建立的 比如 "MySQL"是索引值,那么不可能索引值是"SQL"

这样从中间间断


当我们在查询条件中对索引列做了计算、函数、类型转换操作,这些情况下都会造成索引失效;

为什么呢?还是这个索引被上述操作后,MySQL变得不认识了,从而全表查询


联合索引要能正确使用需要遵循最左匹配原则,也就是按照最左优先的方式进行索引的匹配,否则就会导致索引失效。

假设有一个索引是在列(a, b, c)上的,以下查询会使用到这个索引:

SELECT * FROM table WHERE a = 1;
SELECT * FROM table WHERE a = 1 AND b = 2;
SELECT * FROM table WHERE a = 1 AND b = 2 AND c = 3;

而这些查询不会使用到这个索引:

SELECT * FROM table WHERE b = 2;
SELECT * FROM table WHERE b = 2 AND c = 3;
SELECT * FROM table WHERE c = 3;

因为依靠最左方式建立索引


在 WHERE 子句中,如果在 OR 前的条件列是索引列,而在 OR 后的条件列不是索引列,那么索引会失效。

因为我们查询时,遇到不是索引,那么我们还是需要全表查询,获取数据