加入收藏 | 设为首页 | 会员中心 | 我要投稿 航空爱好网 (https://www.52kongjun.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 站长学院 > MySql教程 > 正文

MYSQL系统架构剖析

发布时间:2022-10-29 16:06:52 所属栏目:MySql教程 来源:
导读:  在之前的文章《一条SQL语句在MYSQL中的执行流程》中简单的对MYSQL的系统架构做了简单的介绍,并不是很详细,趁今天刚学习完赶紧记下来。

  简单回顾下,MYSQL主要有两层架构:

  第二层:存储引擎

  在之前的文章《一条SQL语句在MYSQL中的执行流程》中简单的对MYSQL的系统架构做了简单的介绍,并不是很详细,趁今天刚学习完赶紧记下来。
 
  简单回顾下,MYSQL主要有两层架构:
 
  第二层:存储引擎层,通常也叫Storage Engine Layer,也就是底层数据的存取操作实现的重要部分由多种存储引擎共同组成,常用的InnoDB、MYISAM。
 
  mysql管理器_mysql 管理_mysql log bin 查看器
 
  这里需要注意,这个官方的图看起来结构并不复杂,其实每一层里面会包含很多的小模块,特别是逻辑层。
 
  第一层:逻辑层模块组成1)初始化模块
 
  初始化模块就是在mysql server启动的时候,对整个系统做各种各样的初始化操作,比如各种buffer,cache结构的初始化和内存空间的申请,各种系统变量的初始化设定,各种存储引擎的初始化设置等。初始化模块个人理解是所有软件中的第一道启动关卡,比如spring容器在启动的时候也有一个初始化的过程。
 
  2)核心API
 
  核心API模块主要是为了提供一些需要非常高效的底层操作功能的优化实现,包括各种底层数据结构的实现,特殊算法的实现,字符串处理,数字处理等,小文件I/O,格式化输出,以及最重要的内存管理部分。
 
  3)网络交互模块
 
  底层网络交互模块抽象出底层网络交互所使用的接口api,实现底层网络数据的接收与发送,以方便其他各个模块调用,以及对这一部分的维护。所有源码都在vio文件夹下面。
 
  4)Client&Server交互协议模块
 
  任何C/S结构的软件系统,都肯定会有自己独有的信息交互协议,MySQL也不例外。MySQL 的Client&Server交互协议模块部分,实现了客户端与MySQL交互过程中的所有协议。当然这些协议都是建立在现有的OS和网络协议之上的,如TCP/IP以及UnixSocket。
 
  5)用户模块
 
  用户模块所实现的功能,主要包括用户的登录连接权限控制和用户的授权管理。他就像MySQL的大门守卫一样,决定是否给来访者“开门”。
 
  6)访问控制模块
 
  造访客人进门了就可以想干嘛就干嘛么?为了安全考虑,肯定不能如此随意。这时候就 需要访问控制模块实时监控客人的每一个动作,给不同的客人以不同的权限。访问控制模块 实现的功能就是根据用户模块中各用户的授权信息,以及数据库自身特有的各种约束,来控制用户对数据的访问。用户模块和访问控制模块两者结合起来,组成了MySQL整个数据库系统的权限安全管理的功能。
 
  7)连接管理、连接线程和线程管理
 
  连接管理模块负责监听对MySQLServer的各种请求,接收连接请求,转发所有连接请 求到线程管理模块。每一个连接上MySQLServer的客户端请求都会被分配(或创建)一个连接线程为其单独服务。而连接线程的主要工作就是负责MySQLServer与客户端的通信,接受客户端的命令请求,传递Server端的结果信息等。线程管理模块则负责管理维护这些连接线程。包括线程的创建,线程的cache等。
 
  8)Query解析和转发模块
 
  在MySQL中我们习惯将所有Client端发送给Server端的命令都称为query,在MySQL Server里面,连接线程接收到客户端的一个Query后,会直接将该query传递给专门负责将各种Query进行分类然后转发给各个对应的处理模块,这个模块就是query解析和转发模块。其主要工作就是将query语句进行语义和语法的分析,然后按照不同的操作类型进行分类,然后做出针对性的转发。
 
  9)QueryCache模块
 
  QueryCache模块在MySQL中是一个非常重要的模块,他的主要功能是将客户端提交给MySQL的Select类query请求的返回结果集cache到内存中,与该query的一个hash值做 一个对应。该Query所取数据的基表发生任何数据的变化之后,MySQL会自动使该query的Cache失效。在读写比例非常高的应用系统中,QueryCache对性能的提高是非常显著的。当然它对内存的消耗也是非常大的。
 
  10)Query优化器模块
 
  Query优化器,顾名思义,就是优化客户端请求的query,根据客户端请求的query语 句,和数据库中的一些统计信息,在一系列算法的基础上进行分析,得出一个最优的策略,告诉后面的程序如何取得这个query语句的结果。
 
  11)表变更管理模块
 
  表变更管理模块主要是负责完成一些DML和DDL的query,如:update,delete,insert,createtablemysql管理器,altertable等语句的处理。
 
  12)表维护模块
 
  表的状态检查,错误修复,以及优化和分析等工作都是表维护模块需要做的事情。
 
  13)系统状态管理模块
 
  系统状态管理模块负责在客户端请求系统状态的时候,将各种状态数据返回给用户,像DBA常用的各种showstatus命令,showvariables命令等,所得到的结果都是由这个模块 返回的。
 
  14)表管理器
 
  这个模块从名字上看来很容易和上面的表变更和表维护模块相混淆,但是其功能与变更及维护模块却完全不同。大家知道,每一个MySQL的表都有一个表的定义文件,也就是*.frm 文件。表管理器的工作主要就是维护这些文件,以及一个cache,该cache中的主要内容是各个表的结构信息。此外它还维护table级别的锁管理。
 
  15)日志记录模块
 
  日志记录模块主要负责整个系统级别的逻辑层的日志的记录,包括errorlog,binary log,slowquerylog等。
 
  16)复制模块
 
  复制模块又可分为Master模块和Slave模块两部分,Master模块主要负责在Replication环境中读取Master端的binary日志,以及与Slave端的I/O线程交互等工作。Slave模块比Master模块所要做的事情稍多一些,在系统中主要体现在两个线程上面。一个是负责从Master请求和接受binary日志,并写入本地relaylog中的I/O线程。另外一个是负责从relaylog中读取相关日志事件,然后解析成可以在Slave端正确执行并得到和Master端完全相同的结果的命令并再交给Slave执行的SQL线程。
 
  第二层:存储引擎层存储引擎接口模块
 
  存储引擎接口模块可以说是MySQL数据库中最有特色的一点了。目前各种数据库产品中,基本上只有MySQL可以实现其底层数据存储引擎的插件式管理。这个模块实际上只是一个抽象类,但正是因为它成功地将各种数据处理高度抽象化,才成就了今天MySQL可插拔存 储引擎的特色。
 
  各模块的工作配合
 
  mysql管理器_mysql 管理_mysql log bin 查看器
 
  当我们执行启动 MySQL 命令之后,MySQL 的初始化模块就从系统配置文件中读取系统参数和命令行参数,并按照参数来初始化整个系统,如申请并分配 buffer,初始化全局变量以及各种结构等。同时各个存储引擎也被启动,并进行各自的初始化工作。当整个系统初始化结束后,由连接管理模块接手。连接管理模块会启动处理客户端连接请求的监听程序,包 括 tcp/ip 的网络监听,还有 unix 的 socket。这时候,MySQL Server 就基本启动完成,准备好接受客户端请求了。
 
  当连接管理模块监听到客户端的连接请求(借助网络交互模块的相关功能),双方通过Client & Server 交互协议模块所定义的协议“寒暄”几句之后,连接管理模块就会将连接请求转发给线程管理模块,去请求一个连接线程。线程管理模块马上又会将控制交给连接线程模块,告诉连接线程模块:现在我这边有连接请求过来了,需要建立连接,你赶快处理一下。连接线程模块在接到连接请求后,首先会检查当前连接线程池中是否有被 cache 的空闲连接线程,如果有,就取出一个和客户端请求连接上,如果没有空闲的连接线程,则建立一个新的连接线程与客户端请求连接。当然,连接线程模块并不是在收到连接请求后马上就会取出一个连接线程连和客户端连接,而是首先通过调用用户模块进行授权检查,只有客户端请求通过了授权检查后,他才会将客户端请求和负责请求的连接线程连上。
 
  在 MySQL 中,将客户端请求分为了两种类型:一种是query,需要调用 Parser 也就是Query 解析和转发模块的解析才能够执行的请求;一种是 command,不需要调用 Parser 就可以直接执行的请求。如果我们的初始化配置中打开了 Full Query Logging 的功能,那么Query 解析与转发模块会调用日志记录模块将请求计入日志,不管是一个 Query 类型的请求还是一个 command 类型的请求,都会被记录进入日志,所以出于性能考虑,一般很少打开FullQuery Logging 的功能。
 
  当客户端请求和连接线程“互换暗号(互通协议)”接上头之后,连接线程就开始处理客户端请求发送过来的各种命令(或者 query),接受相关请求。它将收到的 query 语句转给 Query 解析和转发模块,Query 解析器先对 Query 进行基本的语义和语法解析,然后根据命令类型的不同,有些会直接处理,有些会分发给其他模块来处理。
 
  如果是一个 Query 类型的请求,会将控制权交给 Query 解析器。Query 解析器首先分析看是不是一个 select 类型的 query,如果是,则调用查询缓存模块,让它检查该 query 在query cache 中是否已经存在。如果有,则直接将 cache 中的数据返回给连接线程模块,然后通过与客户端的连接的线程将数据传输给客户端。如果不是一个可以被 cache 的 query类型,或者 cache 中没有该 query 的数据,那么 query 将被继续传回 query 解析器,让 query解析器进行相应处理,再通过 query 分发器分发给相关处理模块。
 
  如果解析器解析结果是一条未被 cache 的 select 语句,则将控制权交给 Optimizer,也就是 Query 优化器模块,如果是 DML 或者是 DDL 语句,则会交给表变更管理模块,如果是一些更新统计信息、检测、修复和整理类的 query 则会交给表维护模块去处理,复制相关的query 则转交给复制模块去进行相应的处理,请求状态的 query 则转交给了状态收集报告模块。实际上表变更管理模块根据所对应的处理请求的不同,是分别由 insert 处理器、delete处理器、update 处理器、create 处理器,以及 alter 处理器这些小模块来负责不同的 DML和 DDL 的。
 
  在各个模块收到 Query 解析与分发模块分发过来的请求后,首先会通过访问控制模块检查连接用户是否有访问目标表以及目标字段的权限,如果有,就会调用表管理模块请求相应的表,并获取对应的锁。表管理模块首先会查看该表是否已经存在于 table cache 中,如果已经打开则直接进行锁相关的处理,如果没有在 cache 中,则需要再打开表文件获取锁,然后将打开的表交给表变更管理模块。
 
  当表变更管理模块“获取”打开的表之后,就会根据该表的相关 meta 信息,判断表的存储引擎类型和其他相关信息。根据表的存储引擎类型,提交请求给存储引擎接口模块,调用对应的存储引擎实现模块,进行相应处理。
 
  不过,对于表变更管理模块来说,可见的仅是存储引擎接口模块所提供的一系列“标准”接口,底层存储引擎实现模块的具体实现,对于表变更管理模块来说是透明的。他只需要调用对应的接口,并指明表类型,接口模块会根据表类型调用正确的存储引擎来进行相应的处理。
 
  当一条 query 或者一个 command 处理完成(成功或者失败)之后,控制权都会交还给连接线程模块。如果处理成功,则将处理结果(可能是一个 Result set,也可能是成功或者失败的标识)通过连接线程反馈给客户端。如果处理过程中发生错误,也会将相应的错误信息发送给客户端,然后连接线程模块会进行相应的清理工作,并继续等待后面的请求,重复上面提到的过程,或者完成客户端断开连接的请求。
 
  当一条 query 或者一个 command 处理完成(成功或者失败)之后,控制权都会交还给连接线程模块。如果处理成功,则将处理结果(可能是一个 Result set,也可能是成功或者失败的标识)通过连接线程反馈给客户端。如果处理过程中发生错误,也会将相应的错误信息发送给客户端,然后连接线程模块会进行相应的清理工作,并继续等待后面的请求,重复上面提到的过程,或者完成客户端断开连接的请求。
 
  查询语句的执行流程
 
  接下来看一下select * from t1 where id = 10;这条语句的一个查询过程
 
  上面是查询语句的一个执行流程,修改、删除、更新语句的执行流程下一个文章中再详细讲解,因为还要涉及到redoLog和binLog。
 

(编辑:航空爱好网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!