MYSQL 四、mysql进阶 6(索引的创建与设计原则)

发布于:2024-07-05 ⋅ 阅读:(47) ⋅ 点赞:(0)

一、索引的声明和使用

        1.1 索引的分类
        MySQL的索引包括普通索引、唯一性索引、全文索引、单列索引、多列索引和空间索引等。
  • 功能逻辑 上说,索引主要有 4 种,分别是普通索引、唯一索引、主键索引、全文索引。
  • 按照 物理实现方式 ,索引可以分为 2 种:聚簇索引和非聚簇索引。
  • 按照 作用字段个数 进行划分,分成单列索引和联合索引。
        1. 普通索引
        在创建普通索引时,不附加任何限制条件,只是用于提高查询效率,这类索引可以创建在任何数据类型中,其值是否唯一和非空,要由字段本身的完整性约束条件决定,建立索引以后,可以通过索引进行查询,例如:在表student的字段name字段上建立一个普通索引,查询记录时就可以根据该索引进行查询
        2. 唯一性索引
        使用unique参数可以设置索引为唯一性索引,在创建一唯一性索引时,限制该索引的值必须是唯一的,但允许有空值,在一张数据表里可以有多个唯一索引。
        例如在表student、email中创建唯一性索引,那么字段email的值就必须是唯一的,通过唯一性索引,可以更快速的确定某条记录。
        3. 主键索引
        主键索引就是一种特殊的唯一索引,在唯一索引的基础上增加了不为空的约束,也就是NOT NULL + UNQUIE,一张表里最多只有一个主键索引。
         这是由主键索引的物理实现方式决定的,因为数据存储在文件中只能按照一样顺序进行存储。   
            
        4. 单列索引
        在表中的单个字段上创建索引,单列索引只根据该字段进行索引,单列索引可以是普通索引,也可以是唯一性索引,还可以是全文索引,只要保证该索引只对应一个字段即可,一个表可以有多个单列索引。
        5. 多列 ( 组合、联合 ) 索引
        多列索引在表的多个字段组合上创建一个索引,该索引指向创建时对应的多个字段,可以通过这几个字段进行查询,但是只有查询条件中使用了这些字段中的第一个字段时才会被使用,例如,在表中的字段 id、name、和 gender 上建立一个多列索引 idx_id_name_gender ,只有在查询条件中使用了字段 id 时 该索引才会被使用,使用组合索引时遵循 最左前缀集合。
        6. 全文索引
        全文索引(也称全文检索)是目前搜索引擎使用的一种关键技术,它能够利用 分词技术 等多种算法智能分析出文本文字中关键词的频率和重要性,然后按照一定的算法规则智能的筛选出我们想要的搜索结果,全文索引非常适合大型数据集,对于小的数据集,它的用处比较小。
        使用参数FULLTEXT 可以设置索引为全文索引,在定义索引的列上支持值的全文查找,允许在这些索引列中插入重复值和空值,全文索引只能创建在 CHAR 、VARCHAR或TEXT类型及其系列类型的字段上,查询数据量较大的字符串类型的字段时,使用全文索引可以提高查询速度,例如、表student的字段information是text类型,该字段包含了很多文字信息,在字段information上建立全文索引后,可以提高查询字段information的速度。
全文索引典型的有两种类型:自然语言的全文索引 和 布尔全文索引。
  • 自然语言搜索引擎将计算每一个文档对象和查询的相关度。这里相关度是基于匹配的关键词个数,以及关键词在文档中出现的次数。在整个索引中出现次数越少的词语,匹配时的相关度就越高。相反,非常常见的单词将不会被搜索,如果一个词语的在超过50%的记录中都出现了,那么自然语言的所有将不会搜索这类词语。
        Mysql数据库从3.23.23版开始支持全文索引,但Mysql5.64以前只有Myisam支持,5.6.4啊版本之后innodb才支持,但是官方版本不支持 中文分词 ,需要第三方分词插件,在5.7.6版本,Mysql内置了ngram全文解析器,用来支持亚洲语种的分词。测试或使用全文索引时,要先看一下mysql版本。
        随着大数据时代,关系型数据库应对全文索引的需求已力不从心,逐渐被 solr、ES等专门的搜索引擎所替代。
        7. 补充:空间索引

         使用 参数SPATIAL 可以设置索引为空间索引。空间索引只能建立在空间数据数据类型上,这样就可以提高系统获取空间数据的效率。Mysql的空间数据类型包括 GEOMETRY、POINT、LINESTRING 和 PPLYGON等。目前只有Myisam存储引擎支持空间检索,而且索引的字段不能为空值。对于初学者来说,这类索引很少会用到。

        

        小结:不同的存储引擎支持的索引类型也不一样 

  • InnoDB :支持 B-tree、Full-text 等索引,不支持 Hash 索引;
  • MyISAM : 支持 B-tree、Full-text 等索引,不支持 Hash 索引;
  • Memory :支持 B-tree、Hash 等 索引,不支持 Full-text 索引;
  • NDB :支持 Hash 索引,不支持 B-tree、Full-text 等索引;
  • Archive :不支 持 B-tree、Hash、Full-text 等索引;

        1.2 创建索引

        Mysql支持多种方式在单个或者多个列上创建索引,在创建表的定义语句 Create table 中指定索引列,使用 ALTER TABLE 语句在存在的表上创建索引,或者使用 CREATE INDEX 语句在已存在的表上添加索引。

        1、创建表的时候创建索引

        使用CREATE TABLE 创建表时,除了可以定义列的数据类型外,还可以定义主键约束、外键约束或者唯一性约束,而不论创建哪种约束,在定义约束的同时相当于在指定列上创建了一个索引

举例:

CREATE TABLE dept(
        dept_id INT PRIMARY KEY AUTO_INCREMENT ,
        dept_name VARCHAR ( 20 )
);
CREATE TABLE emp(
        emp_id INT PRIMARY KEY AUTO_INCREMENT ,
        emp_name VARCHAR ( 20 ) UNIQUE ,
        dept_id INT ,
        CONSTRAINT emp_dept_id_fk FOREIGN KEY (dept_id) REFERENCES dept(dept_id)
);

         但是,如果显式创建表时创建索引的话,基本语法格式如下:

CREATE TABLE table_name [col_name data_type]
[UNIQUE | FULLTEXT | SPATIAL] [INDEX | KEY] [index_name] (col_name [length]) [ASC |DESC]
  • UNIQUE 、 FULLTEXT 和 SPATIAL 为可选参数,分别表示唯一索引、全文索引和空间索引;
  • INDEX 与 KEY 为同义词,两者的作用相同,用来指定创建索引;
  • index_name 指定索引的名称,为可选参数,如果不指定,那么MySQL默认col_name为索引名;
  • col_name 为需要创建索引的字段列,该列必须从数据表中定义的多个列中选择;
  • length 为可选参数,表示索引的长度,只有字符串类型的字段才能指定索引长度;
  • ASC 或 DESC 指定升序或者降序的索引值存储。

        1. 创建普通索引 

 book表中的year_publication字段上建立普通索引,SQL语句如下:

CREATE TABLE book(
        book_id INT ,
        book_name VARCHAR ( 100 ),
        authors VARCHAR ( 100 ),
        info VARCHAR ( 100 ) ,
        comment VARCHAR ( 100 ),
        year_publication YEAR ,
        INDEX (year_publication)
);

         2. 创建唯一索引

举例:
CREATE TABLE test1(
        id INT NOT NULL ,
        name varchar ( 30 ) NOT NULL ,
        UNIQUE INDEX uk_idx_id(id)
);
该语句执行完毕之后,使用 SHOW CREATE TABLE 查看表结构:
SHOW INDEX FROM test1 \G

         3. 主键索引

设定为主键后数据库会自动建立索引,innodb为聚簇索引,语法:

随表一起建索引:
CREATE TABLE student (
        id INT ( 10 ) UNSIGNED AUTO_INCREMENT ,
        student_no VARCHAR ( 200 ),
        student_name VARCHAR ( 200 ),
        PRIMARY KEY (id)
);
删除主键索引:
ALTER TABLE student   drop PRIMARY KEY ;
修改主键索引:必须先删除掉(drop)原索引,再新建(add)索引

         4. 创建单列索引

举例: 

CREATE TABLE test2(
        id INT NOT NULL ,
        name CHAR ( 50 ) NULL ,
        INDEX single_idx_name(name( 20 ))
);
该语句执行完毕之后,使用SHOW CREATE TABLE查看表结构:
SHOW INDEX FROM test2 \G
        5. 创建组合索引  

 举例:创建表test3,在表中的idnameage字段上建立组合索引,SQL语句如下:

CREATE TABLE test3(
        id INT ( 11 ) NOT NULL ,
        name CHAR ( 30 ) NOT NULL ,
        age INT ( 11 ) NOT NULL ,
        info VARCHAR ( 255 ),
        INDEX multi_idx(id,name,age)
);
该语句执行完毕之后,使用SHOW INDEX 查看:
SHOW INDEX FROM test3 \G

     6. 创建全文索引

举例1:创建表test4,在表中的info字段上建立全文索引,SQL语句如下:

CREATE TABLE test4(
        id INT NOT NULL ,
        name CHAR ( 30 ) NOT NULL ,
        age INT NOT NULL ,
        info VARCHAR ( 255 ),
        FULLTEXT INDEX futxt_idx_info(info)
) ENGINE =MyISAM;
MySQL5.7及之后版本中可以不指定最后的ENGINE了,因为在此版本中InnoDB支持全文索引。

举例2 创建了一个给 titlebody字段添加全文索引的表。
CREATE TABLE articles (
        id INT UNSIGNED AUTO_INCREMENT PRIMARY KEY ,
        title VARCHAR ( 200 ),
        body TEXT ,
        FULLTEXT index (title, body)
) ENGINE = INNODB ;

举例 3
CREATE TABLE `papers` (
        `id` int ( 10 ) unsigned NOT NULL AUTO_INCREMENT ,
        `title` varchar ( 200 ) DEFAULT NULL ,
        `content` text ,
        PRIMARY KEY ( `id` ),
        FULLTEXT KEY `title` ( `title` , `content` )
) ENGINE =MyISAM DEFAULT CHARSET =utf8;

不同于 like 方式的的查询:
SELECT * FROM papers WHERE content LIKE ‘% 查询字符串%’;

全文索引用
match+against方式查询:
SELECT * FROM papers WHERE MATCH (title,content) AGAINST (‘ 查询字符串’);

注意点
1. 使用全文索引前,搞清楚版本支持情况;
2. 全文索引比 like + % N 倍,但是可能存在精度问题;
3. 如果需要全文索引的是大量数据,建议先添加数据,再创建索引。

         7. 创建空间索引

空间索引创建中,要求空间类型的字段必须为 非空
举例:创建表
test5,在空间类型为GEOMETRY的字段上创建空间索引,SQL
语句如下:

CREATE TABLE test5(
        geo GEOMETRY NOT NULL ,
        SPATIAL INDEX spa_idx_geo(geo)
) ENGINE =MyISAM;

        2. 在已经存在的表上创建索引

 在已经存在的表中创建索引可以使用ALTER TABLE语句或者CREATE INDEX语句。

1. 使用 ALTER TABLE 语句创建索引 ALTER TABLE 语句创建索引的基本语法如下:
ALTER TABLE table_name ADD [ UNIQUE | FULLTEXT | SPATIAL ] [ INDEX | KEY ]
[index_name] (col_name[length],...) [ ASC | DESC ]
2. 使用 CREATE INDEX 创建索引 CREATE INDEX 语句可以在已经存在的表上添加索引,在 MySQL 中, CREATE INDEX被映射到一个 ALTER TABLE 语句上,基本语法结构为:

CREATE [ UNIQUE | FULLTEXT | SPATIAL ] INDEX index_name
ON table_name (col_name[length],...) [ ASC | DESC ]

       1.3 删除索引  
1. 使用 ALTER TABLE 删除索引 ALTER TABLE删除索引的基本语法格式如下:
ALTER TABLE table_name DROP INDEX index_name;
提示 添加AUTO_INCREMENT约束字段的唯一索引不能被删除。

2. 使用 DROP INDEX 语句删除索引 DROP INDEX 删除索引的基本语法格式如下:
DROP INDEX index_name ON table_name ;
 
提示 删除表中的列时,如果要删除的列为索引的组成部分,则该列也会从索引中删除。如果组成 索引的所有列都被删除,则整个索引将被删除。

 二、 MySQL8.0索引新特性

         2.1 支持降序索引

         降序索引以降序存储键值,虽然在语法上,从Mysql 4版本开始就已经支持降序索引的语法了,但实际上该DESC定义是被忽略的,直到Mysql 8.x版本才开始真正支持降序索引(仅限于InnoDB 存储引擎)。
        Mysql在8.0版本之前创建的仍然是升序索引,使用时进行反向扫描,这大大降低了数据库的效率。在某些场景下。降序索引意义重大。例如,如果一个查询,需要对多个列进行排序,且顺序要求不一致。那么使用降序索引将会避免数据库使用额外的文件排序操作。从而提高性能。

 举例:分别在MySQL 5.7版本和MySQL 8.0版本中创建数据表ts1,结果如下: 

 CREATE TABLE ts1(a int,b int,index idx_a_b(a asc,b desc));

 # 这样创建的意思就是 我们创建a,b字段 先用a字段进行升序排,再用b字段进行降序排。


 在MySQL 5.7版本中查看数据表ts1的结构,结果如下:

从结果可以看出,索引仍然是默认的升序。
 
MySQL 8.0版本中查看数据表ts1的结构,结果如下:

 
从结果可以看出,索引已经是降序了。下面继续测试降序索引在执行计划中的表现。
 
分别在MySQL 5.7版本和MySQL 8.0版本的数据表ts1中插入800条随机数据,执行语句如下:
DELIMITER //
CREATE PROCEDURE ts_insert()
BEGIN
        DECLARE i INT DEFAULT 1 ;
        WHILE i < 800
        DO
                insert into ts1 select rand()* 80000 ,rand()* 80000 ;
                SET i = i + 1 ;
        END WHILE ;
        commit ;
END //
DELIMITER ;
#调用
CALL ts_insert();

MySQL 5.7版本中查看数据表ts1的执行计划,结果如下:

EXPLAIN SELECT * FROM ts1 ORDER BY a,b DESC LIMIT 5 ;
从结果可以看出,执行计划中扫描数为799 ,而且使用了 Using filesort

提示 Using filesortMySQL中一种速度比较慢的外部排序,能避免是最好的。多数情况下,管理员 可以通过优化索引来尽量避免出现Using filesort,从而提高数据库执行速度。

MySQL 8.0版本中查看数据表ts1的执行计划。从结果可以看出,执行计划中扫描数为5,而且没有使用 Using filesort。
注意 降序索引只对查询中特定的排序顺序有效,如果使用不当,反而查询效率更低。例如,上述 查询排序条件改为order by a desc, b desc MySQL 5.7 的执行计划要明显好于 MySQL 8.0
将排序条件修改为order by a desc, b desc后,下面来对比不同版本中执行计划的效果。 在MySQL 5.7版本 中查看数据表ts1的执行计划,结果如下:
EXPLAIN SELECT * FROM ts1 ORDER BY a DESC ,b DESC LIMIT 5 ;
MySQL 8.0 版本中查看数据表 ts1 的执行计划。
从结果可以看出,修改后 MySQL 5.7 的执行计划要明显好于 MySQL 8.0

         2.2 隐藏索引

        在MySQL 5.7版本及之前,只能通过显式的方式删除索引。此时,如果发现删除索引后出现错误,又只能通过显式创建索引的方式将删除的索引创建回来。如果数据表中的数据量非常大,或者数据表本身比较大,这种操作就会消耗系统过多的资源,操作成本非常高。

        从MySQL 8.x开始支持 隐藏索引(invisible indexes,只需要将待删除的索引设置为隐藏索引,使查询优化器不再使用这个索引(即使使用force index(强制使用索引),优化器也不会使用该索引), 确认将索引设置为隐藏索引后系统不受任何响应,就可以彻底删除索引。 这种通过先将索引设置为隐藏索 引,再删除索引的方式就是软删除

        同时,如果想验证某个索引删除之后的 查询性能影响,就可以暂时先隐藏该索引。 

  注意:
主键不能被设置为隐藏索引。当表中没有显式主键时,表中第一个唯一非空索引会成为隐式主键,也不能设置为隐藏索引。

        索引默认是可见的,在使用CREATE TABLE, CREATE INDEX 或者 ALTER TABLE 等语句时可以通过 VISIBLE 或者 INVISIBLE 关键词设置索引的可见性。

 1. 创建表时直接创建 MySQL中创建隐藏索引通过SQL语句INVISIBLE来实现,其语法形式如下:

CREATE TABLE tablename(
        propname1 type1[CONSTRAINT1],
        propname2 type2[CONSTRAINT2],
        ……
        propnamen typen,
        INDEX [indexname](propname1 [(length)]) INVISIBLE
);
上述语句比普通索引多了一个关键字 INVISIBLE,用来标记索引为不可见索引。

2. 在已经存在的表上创建
可以为已经存在的表设置隐藏索引,其语法形式如下:
CREATE INDEX indexname   ON tablename(propname[(length)]) INVISIBLE;
 
3. 通过 ALTER TABLE 语句创建
语法形式如下:
ALTER TABLE tablename
ADD INDEX indexname (propname [(length)]) INVISIBLE;

4. 切换索引可见状态 已存在的索引可通过如下语句切换可见状态:
ALTER TABLE tablename ALTER INDEX index_name INVISIBLE; # 切换成隐藏索引
ALTER TABLE tablename ALTER INDEX index_name VISIBLE; # 切换成非隐藏索引

如果将index_cname索引切换成可见状态,通过explain查看执行计划,发现优化器选择了index_cname索 引。
注意 当索引被隐藏时,它的内容仍然是和正常索引一样实时更新的。如果一个索引需要长期被隐 藏,那么可以将其删除,因为索引的存在会影响插入、更新和删除的性能。
通过设置隐藏索引的可见性可以查看索引对调优的帮助。

 

5. 使隐藏索引对查询优化器可见
        在MySQL 8.x版本中,为索引提供了一种新的测试方式,可以通过查询优化器的一个开关 (use_invisible_indexes )来打开某个设置,使隐藏索引对查询优化器可见。如果 use_invisible_indexes 设置为off( 默认 ) ,优化器会忽略隐藏索引。如果设置为 on ,即使隐藏索引不可见,优化器在生成执行计 划时仍会考虑使用隐藏索引。

(1)在MySQL命令行执行如下命令查看查询优化器的开关设置。
mysql>
select @@optimizer_switch \G
在输出的结果信息中找到如下属性配置。
        use_invisible_indexes=off
此属性配置值为off,说明隐藏索引默认对查询优化器不可见。

2)使隐藏索引对查询优化器可见,需要在MySQL命令行执行如下命令:

mysql> set session optimizer_switch= "use_invisible_indexes=on" ;
Query OK, 0 rows affected ( 0.00 sec)
 
SQL语句执行成功,再次查看查询优化器的开关设置。
mysql> select @@optimizer_switch \G
*************************** 1. row ***************************
@@optimizer_switch :
index_merge= on ,index_merge_union= on ,index_merge_sort_union= on ,index_merge_
intersection= on ,engine_condition_pushdown= on ,index_condition_pushdown= on ,mrr= on ,mrr_co
st_based= on ,block_nested_loop= on ,batched_key_access=off,materialization= on ,semijoin= on
,loosescan= on ,firstmatch= on ,duplicateweedout= on ,subquery_materialization_cost_based= on
,use_index_extensions= on ,condition_fanout_filter= on ,derived_merge= on ,use_invisible_ind
exes= on ,skip_scan= on ,hash_join= on

1 row in set (0.00 sec)

此时,在输出结果中可以看到如下属性配置。

use_invisible_indexes=on
use_invisible_indexes属性的值为on,说明此时隐藏索引对查询优化器可见。
 

3)使用EXPLAIN查看以字段invisible_column作为查询条件时的索引使用情况。
explain select * from classes where cname = '高一2';
查询优化器会使用隐藏索引来查询数据。
 

4)如果需要使隐藏索引对查询优化器不可见,则只需要执行如下命令即可。

mysql> set session optimizer_switch= "use_invisible_indexes=off" ;
Query OK, 0 rows affected ( 0.00 sec)
 
再次查看查询优化器的开关设置。
mysql> select @@optimizer_switch \G
此时, use_invisible_indexes 属性的值已经被设置为 “off”

三、索引的设计原则

        


网站公告

今日签到

点亮在社区的每一天
去签到