大家好,欢迎来到IT知识分享网。
1、索引概述
索引(index)是帮助Mysql高效获取数据的数据结构(有序)。在数据之外,数据库系统还维护着满足特定查找算法的数据结构,这些数据结构以某种方式引用(指向)数据,这样就可以在这些数据结构上实现高级查找算法,这种数据结构就是索引。
索引的数据结构:二叉树、B-TREE、B+TREE等
索引是帮助 MySQL 高效获取数据的数据结构(有序)。在数据之外,数据库系统还维护着满足特定查找算法的数据结构,这些数据结构以某种方式引用(指向)数据,这样就可以在这些数据结构上实现高级查询算法,这种数据结构就是索引。
2、索引优缺点
索引是一种高效获取数据的数据结构
优点 |
缺点 |
提高数据的检索效率,降低数据库的IO成本 |
索引列也是要占用空间的 |
通过索引列对数据进行排序,降低数据排序的成本,降低cpu的消耗 |
索引大大提高了查询的效率,同时也降低了更新表的速度,如对表进行插入、修改、删除时,会导致索引重排序,效率降低 |
使用索引可以大大减少服务器需要扫描的数据量;
使用索引可以帮助服务器避免排序或者临时表;
索引是随机I/O变为顺序I/O;
3、索引语法
- 创建索引:
CREATE [ UNIQUE | FULLTEXT ] INDEX index_name ON table_name (index_col_name, …);
如果不加 CREATE 后面不加索引类型参数,则创建的是常规索引 - 查看索引:
SHOW INDEX FROM table_name; - 删除索引:
DROP INDEX index_name ON table_name;
-- name字段为姓名字段,该字段的值可能会重复,为该字段创建索引 create index idx_user_name on tb_user(name); -- phone手机号字段的值非空,且唯一,为该字段创建唯一索引 create unique index idx_user_phone on tb_user (phone); -- 为profession, age, status创建联合索引 create index idx_user_pro_age_stat on tb_user(profession, age, status); -- 为email建立合适的索引来提升查询效率 create index idx_user_email on tb_user(email); -- 删除索引 drop index idx_user_email on tb_user;
4、索引结构
MySQL的索引是在储存引擎层实现的,不同的储存引擎有不同的储存结构,主要包含以下几种:
索引结构 |
描述 |
B+Tree索引 |
最常见的索引类型,大部分引擎都支持B+树索引 |
Hash索引 |
底层数据结构是用哈希表实现的,只有精确匹配索引列的查询才有效,不支持范围查询 |
R-Tree索引(空间索引) |
空间索引是MYSAM引擎的一个特殊索引类型,主要用于地理空间数据类型,通常使用较少 |
Full-text(全文索引) |
是一种通过建立倒排索引,快速匹配文档的方式,类似于:Lucene/solr/ES |
5、索引分类
索引类型
索引类型分为:主键索引(primary key)、普通索引(key)、唯一索引(unique key)、全文索引(fulltext key)
索引储存形式
聚集索引:将数据存储与索引放到一块,索引结构的叶子节点保存了行数据
二级索引:将数据与索引分开来存储,索引结构的叶子节点关联的是对应的主键
聚集索引选取规则:
- 如果存在主键,主键索引就是聚集索引
- 如果不存在主键,将使用第一个唯一(UNIQUE)索引作为聚集索引
- 如果表没有主键或没有合适的唯一索引,则 InnoDB 会自动生成一个 rowid 作为隐藏的聚集索引
6、索引设计原则
最左前缀法则
如果索引关联了多列(联合索引),要遵守最左前缀法则,最左前缀法则指的是查询从索引的最左列开始,并且不跳过索引中的列。
如果跳跃某一列,索引将部分失效(后面的字段索引失效)。
联合索引中,出现范围查询(<, >),范围查询右侧的列索引失效。可以用>=或者<=来规避索引失效问题。
7、索引使用
索引并不是适用于任何情况,对于中型、大中型表适用,对于小型表全表扫描更高效,而对于特大型表,需要考虑分区技术
8、SQL性能分析
查看执行频次
-- 查看当前数据库的 INSERT, UPDATE, DELETE, SELECT 访问频次 SHOW GLOBAL STATUS LIKE 'Com'; SHOW SESSION STATUS LIKE 'Com'; --案例: show global status like 'Com___'
慢查询日志
慢查询日志记录了所有执行时间超过指定参数(long_query_time,单位:秒,默认10秒)的所有SQL语句的日志。
查看慢查询日志开关状态:show variables like ‘slow_query_log’;
MySQL的慢查询日志默认没有开启,需要在MySQL的配置文件(/etc/my.cnf)中配置如下信息:
# 开启慢查询日志开关 slow_query_log=1 # 设置慢查询日志的时间为2秒,SQL语句执行时间超过2秒,就会视为慢查询,记录慢查询日志 long_query_time=2
更改后记得重启MySQL服务,日志文件位置:/var/lib/mysql/localhost-slow.log
profile
show profile 能在做SQL优化时帮我们了解时间都耗费在哪里。通过 have_profiling 参数,能看到当前 MySQL 是否支持 profile 操作:
SELECT @@have_profiling;
profiling 默认关闭,可以通过set语句在session/global级别开启 profiling:
SET profiling = 1;
查看所有语句的耗时:
show profiles;
查看指定query_id的SQL语句各个阶段的耗时:
show profile for query query_id;
查看指定query_id的SQL语句CPU的使用情况
show profile cpu for query query_id;
explain
EXPLAIN 或者 DESC 命令获取 MySQL 如何执行 SELECT 语句的信息,包括在 SELECT 语句执行过程中表如何连接和连接的顺序。
直接在select语句之前加上关键字 explain / desc
语法:EXPLAIN SELECT 字段列表 FROM 表名 HWERE 条件;
EXPLAIN 各字段含义:
● id:select 查询的序列号,表示查询中执行 select 子句或者操作表的顺序(id相同,执行顺序从上到下;id不同,值越大越先执行)
● select_type:表示 SELECT 的类型,常见取值有 SIMPLE(简单表,即不适用表连接或者子查询)、PRIMARY(主查询,即外层的查询)、UNION(UNION中的第二个或者后面的查询语句)、SUBQUERY(SELECT/WHERE之后包含了子查询)等
● type:表示连接类型,性能由好到差的连接类型为 NULL、system、const、eq_ref、ref、range、index、all
● possible_key:可能应用在这张表上的索引,一个或多个
● Key:实际使用的索引,如果为 NULL,则没有使用索引
● Key_len:表示索引中使用的字节数,该值为索引字段最大可能长度,并非实际使用长度,在不损失精确性的前提下,长度越短越好
● rows:MySQL认为必须要执行的行数,在InnoDB引擎的表中,是一个估计值,可能并不总是准确的
● filtered:表示返回结果的行数占需读取行数的百分比,filtered的值越大越好
免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。 本文来自网络,若有侵权,请联系删除,如若转载,请注明出处:https://yundeesoft.com/88615.html