最近刚刚购买了极客时间的课程《MySQL实战45讲》,我会在这里将学习到的知识点做一个总结。
本节主要是讲MySQL的基础架构。比如执行以下语句时:
mysql> select * from T where ID=10;复制代码这条语句在MySQL内部是如何处理的。
基础架构图
如图 主体分为两部分:Server和存储引擎部分。
Server包括:连接器、缓存查询、分析器、优化器、执行器。存储过程、触发器、视图等功能都在Server层处理。
存储引擎负责数据的存储和提取。常见的有InnoDB、MyISAM。
连接器连接器与客户端建立连接、获取权限、维持和管理连接。
常见的命令:
mysql -uroot -ppassword
用来和服务器建立连接,TCP握手后完成认证过程。
- 账号密码不对,报错:"Access denied for user"
- 认证通过,在权限表中查询拥有的权限
只有在连接过程才会从权限表中读取权限信息,中途对权限的修改不会影响已经建立的连接,只有重新登陆后才会使用新的权限信息。
建立连接后如果长时间处于空闲状态,"show processlist" 命令可以看到到处于sleep状态的连接。
若规定时间内无活动,则会自动断开连接。规定时间 由 wait_timeout控制,默认为8小时。断开后,再次发请回会提示 "Lost connection to MySQL server during query" ,只能重新连接。
防止数据库中出现占用大量内存的情况,可以用一下方法解决:
- 定期断开长连接或者占用内存过大的连接。
- MySQL5.7及以上版本,每次执行一个较大的操作,可执行 "mysql_reset_connection"命令来初始化连接资源,该操作不会重连和重新获取授权,只是恢复到刚建立连接的状态。
查询缓存建立连接后,就可以执行select操作,这是会执行第二部分:查询缓存。
一个请求进来,首先查询缓存,是否存在该记录。之前执行过的语句,则会以语句为key,执行后的结果集为value存储在内存中。
- 如果在缓存中查找到,则回直接返回给客户端。
- 如果没有找到记录,继续执行后面的操作,并将该语句与结果分别以key-value存入内存。
不建议使用查询缓存,此操作弊大于利 ( MySQL8.0后将会删除该功能 )
对于一个表,只要有更新便会将涉及到该表的缓存全部清空。
只适用于不常更新的静态表
推荐:
-将query_cache_type 设置为 DEMAND,默认SQL不使用查询缓存,针对需要查询缓存的语句,使用SQL_cache显示指定,例如:
select SQL_CACHE * from T where ID = 10;复制代码分析器这条SQL要做什么
- 词法分析
识别SQL关键字,提出主要成分。MySQL根据"select"得出这是一条查询语句,根据"from T"识别表T,将"ID"识别为列名。 - 语法分析
根据语法规则判断是否符合SQL的语法。如果出现错误,则提示:"You have an error in your SQL syntax...",后面是错误的地方,需要你关注"use naer"后的内容。
优化器这条SQL如何做
这个步骤将会选取最优的执行方式,例如:
- 当涉及到多个索引时,决定用哪个索引
- 多表关联时,决定连接顺序select * from t1 join t2 using(ID) where t1.c=10 and t2.d=20;复制代码该步骤决定了先从t1表中取出c=10的ID值还是先查找出t2表中d=20的ID值。
执行器真正的执行步骤
根据连接器取到的权限判断,是否对表T有权限。
打开表后,根据表的引擎定义,使用引擎提供的接口。例:
- 表T中ID字段无索引:
- 调用InnoDB提供的接口,取出第一行,当ID=10时,将该行数据放入结果集。若不符合则字啊次调用引擎接口获取下一行,再次判断,直至最后一行数据。
- 将结果集存入缓存、返回给客户端。
- 表T中ID字段有索引:
- 调用InnoDB的"获取满足条件的第一行"接口,server层还会再判断一次值是否正确,然后放入结果集,接着继续访问"满足条件的下一行"接口,这些接口是引擎已经定义好的。
在MySQL的慢查询日志中,rows_examined字段表示该语句执行过程中扫描了多少行,这个值就是调用引擎获取数据行的时候添加的。
某些场景下,执行器调用一次,引擎内部会扫描很多行,因此引擎扫描行数跟rows_examined并不完全相同,这一点后文会详细说明。
评论区知识点:
- 问题:如果查询语句中的字段不存在,会在哪个阶段报错?
- 答案:会在分析器阶段报错。
- 《高性能MySQL》提到解析器和预处理器解析器:处理语法和解析查询,生成一颗对应的解析树。预处理器:进一步检查解析树的合法性,比如:数据表和数据列是否存在,别名是否有歧义等。如果通过则生成新的解析树,在提交给优化器。
- Connect_timeout 指的是“连接过程中”的等待时间
- wait_timeout指的是“连接完成后,使用过程中”的等待时间
【转载】
作者:Justd
链接:https://juejin.im/post/5bf576ad6fb9a049b221823a
|
|