MySQL慢sql优化思路详细讲解

时间:2023-02-02 零点冰. 人气:0

1、开启Mysql慢查询

1.1、查看慢查询相关配置

show variables like 'slow_query_log%'

slow_query_log 表示慢查询开启的状态

slow_query_log_file 表示慢查询日志存放的位置

1.2、查询慢查询sql耗时临界点

show variables like 'long_query_time'

long_query_time 表示查询超过多少秒才记录到慢查询日志。

1.3、开启Mysql慢查询

方式一：修改配置文件开启慢查询

在my.ini增加如下配置

# 定义sql耗时多少秒就算是慢查询，记录慢查询日志
long_query_time=2
 
# 开启慢查询
slow_query_log=on
 
# 定义慢查询日志文件名
slow_query_log_file=/usr/local/mysql/mysql-slow-query.log

方式二：通过命令开启慢查询

set global slow_query_log=ON    # 开启慢查询日志
set global long_query_time=2    # SQL查询时间大于2秒，则记录慢查询日志

2、explain查看SQL执行计划

explain + SQL，查看SQL的执行计划。重点关注type、rows、extra、key指标。

2.1、Select_type

查询类型：

SIMPLE ：表示查询语句不包含子查询或union
PRIMARY：表示此查询是最外层的查询
UNION：表示此查询是UNION的第二个或后续的查询
DEPENDENT UNION：UNION中的第二个或后续的查询语句，使用了外面查询结果
UNION RESULT：UNION的结果
SUBQUERY：SELECT子查询语句
DEPENDENT SUBQUERY：SELECT子查询语句依赖外层查询的结果

2.2、Type

存储引擎查询数据时采用的方式：

性能：NULL > const > eq_ref > ref > range > index > ALL

ALL：表示全表扫描，性能最差。
index：表示基于索引的全表扫描，先扫描索引再扫描全表数据。
range：表示使用索引范围查询。使用>、>=、<、<=、in等等。
ref：表示使用非唯一索引进行单值查询。
eq_ref：一般情况下出现在多表join查询，表示前面表的每一个记录，都只能匹配后面表的一行结果。
const：表示使用主键或唯一索引做等值查询，常量查询。
NULL：表示不用访问表，速度最快。

2.3、Possible_keys

表示查询时可能使用到的索引。

2.4、Key

查询时真正使用到的索引。

2.5、Key_len

表示查询使用了索引的字节数量。可以判断是否全部使用了组合索引。

字符串类型

字符串长度跟字符集有关：latin1=1、gbk=2、utf8=3、utf8mb4=4

char(n)：n*字符集长度

varchar(n)：n * 字符集长度 + 2字节

数值类型

TINYINT：1个字节 SMALLINT：2个字节 MEDIUMINT：3个字节

INT、FLOAT：4个字节 BIGINT、DOUBLE：8个字节

时间类型

DATE：3个字节 TIMESTAMP：4个字节 DATETIME：8个字节

字段属性

NULL属性占用1个字节，如果一个字段设置了NOT NULL，则没有此项

2.6、Rows

SQL查询扫描的行数，行数越小越好。MySQL查询优化器会根据统计信息，估算SQL要查询到结果需要扫描多少行记录。

2.7、Extra

额外信息。

Using where：表示查询需要通过索引回表查询数据。
Using index：表示查询需要通过索引，索引就可以满足所需数据。
Using filesort：表示查询出来的结果需要额外排序，数据量小在内存，大的话在磁盘，因此有Using filesort建议优化。
Using temprorary：查询使用到了临时表，一般出现于去重、分组等操作。
Using index condition：MySQL5.6之后新增的索引下推。在存储引擎层进行数据过滤，而不是在服务层过滤，利用索引现有的数据减少回表的数据。

3、profile 分析执行耗时

观测SQL真正的执行线程状态及消耗的时间。

3.1、查询profile开启状态

show variables like '%profil%'

have_profiling：确定是否支持 profile
profiling：是否开启profiling
profiling_history_size：定义MySQL服务器最近接收到的SQL条数。

3.2、开启profiling

执行如下SQL：

set profiling=ON
set profiling_history_size=30

3.3、查看最近运行的SQL

3.3.1、show profiles

查询最近SQL的执行耗时。

-- 查询最近profiling_history_size条SQL
show profiles;

3.3.2、show profile for query id

查询一条SQL从开始到结束整个生命周期各个阶段的执行耗时。

-- 根据query_id查询指定SQL执行耗时
show profile for query id

4、Optimizer Trace分析详情

profile只能查询SQL执行耗时，无法看到SQL具体的执行信息。

Optimizer Trace：可以跟踪执行语句的解析优化执行的全过程。

4.1、分析流程

打开开关

set optimizer_trace="enabled=on"

执行需要分析的SQL执行跟踪

select * from information_schema.optimizer_trace

4.2、结果分析

join_preparation：准备阶段
join_optimization：分析阶段
join_execution：执行阶段

5、慢查询经典案例总结

以user表为例举例说明：

CREATE TABLE user (
  id int(11) NOT NULL AUTO_INCREMENT,
  user_id varchar(32) NOT NULL,
  age  varchar(16) NOT NULL,
  name varchar(255) NOT NULL,
  PRIMARY KEY (id),
  KEY idx_userid (userId) USING BTREE
) ENGINE=InnoDB DEFAULT CHARSET=utf8;

5.1、隐式类型转换

把userId设为索引，如果在查询条件中把一个数字传给user_id，则索引失效。

# user_id索引失效，传的是数字123，索引user_id类型为字符串，两者类型不匹配
# MySql会将user_id转换为字符串再进行比较。
select *from user where user_id = 123
 
# 走userId索引
select *from user where user_id = '123'

5.2、最左匹配

不满足最左匹配原则，索引不生效。

5.3、limit深分页问题

MySql会查询满足条件的100010行，然后丢弃前100000行，返回最后10行。

select *from user where age > 20 limit 100000,10

解决方案：减少回表

标签记录法：

标记一下上次查询到哪一条了，下次再来查的时候，从该条开始往下扫描。

# 标签记录法：局限是要求id连续
select *from user where id > 100000 limit 10

延迟关联法：

把条件转移到主键索引树，减少回表。

# 为age字段创建索引，通过age索引查询到满足条件的id，再与原表通过id内连接
select user1.id, user1.age, user1.name 
FROM user user1 
INNER JOIN (
    SELECT u.id FROM user u WHERE u.age > 20 limit 100000, 10
) AS user2 on user1.id= user2.id;

5.4、in元素过多

如果in中的元素过多，建议分组查询，一次200个。

select * from user where user_id in (1,2,3...200)
union all
select * from user where user_id in (201,202,203...400)

5.5、order走文件排序导致的慢查询

执行计划如下，Extra中包含了Using filesort(文件排序)。

因为数据是无序的，所以就需要排序。如果数据本身是有序的，那就不会再用到文件排序啦。而索引数据本身是有序的，我们通过建立索引来优化order by语句。

我们还可以通过调整max_length_for_sort_data、sort_buffer_size等参数优化；

5.6、索引字段使用is null 或 is not null可能导致索引失效

有时可能因为数据量问题，导致MySQL优化器放弃走索引。另外，用explain分析SQL的时候，需要注意type=range时，可能会因为数据量问题，导致索引无效。

5.7、索引字段上使用（！= 或者 < >, not in）可能导致索引失效

如果优化器觉得即使走了索引，还是需要扫描很多很多行的哈，它觉得不划算，不如直接不走索引。

5.8、左右连接，关联的字段编码格式不一致

select u.name, j.name, j.job
from user u
left join user_job j on u.name = j.name

将user表的name字段以及user_job表的name字段均设置索引

假设user表的name字段编码为utf8，user_job表的name字段编码为utf8mb4，则上述sql查询不走索引。
假设user表的name字段编码和user_job表的name字段编码均为utf8，则上述sql查询走索引。

5.9、delete + in子查询不走索引

delete from user where name in (select name from old_user)

delete + in子查询不走索引
select + in子查询走索引

这是因为，实际执行的时候，MySQL对select in子查询做了优化，把子查询改成join的方式，所以可以走索引。但是对于delete in子查询，MySQL却没有对它做这个优化。

总结

加载全部内容