Wayned's Blog

如何提问是一个好问题

Aug 27, 2023 - 3 minute read - DB MySQL

高性能 MySQL(二)MySQL 架构与历史

[toc]

1. 介绍

要想解决日常工作中遇到的 MySQL 性能问题,充分发挥 MySQL 的性能,就必须了解其设计。

MySQL 最重要、最与众不同的特性是它的存储引擎架构,这种架构的设计将查询处理(Query Processing)即其他系统任务(Server Task)和数据的存储、提取相分离。这种查询处理和存储分离的设计使得 MySQL 在使用时根据性能、特性以及其他需求来选择数据存储的方式。 本篇将主要介绍下 MySQL 的服务架构、不同存储引擎之间的主要区别及重要性。

2. MySQL 逻辑架构

下图是 MySQL 的逻辑架构图: MySQL 逻辑架构图 从图中我们可以看出 MySQL 从逻辑架构上大概分为三层:

  1. 连接层:大多数基于网络的客户端/服务器的工具或者服务都有类似的架构。这一层一般负责连接处理、授权认证、安全管理等。
  2. 核心功能层:大多数 MySQL 的核心服务功能都在这一层,包括查询解析、分析、优化、缓存以及所有的内置函数(日期、实践、数学和加密函数等),所有跨存储引擎的功能都在这一层实现:存储过程、触发器、视图等。
  3. 存储引擎层:存储引擎负责 MySQL 中数据的存储和提取。服务器通过 API 与存储引擎进行通信。这些 API 屏蔽了不同存储引擎之间的差异,使得这些差异对于上层的功能层透明。存储引擎 API 包含十几个底层函数,比如“开始一个事务”或者“根据主键提取一行记录”等操作。存储引擎一般不会解析 SQL,不同存储引擎之间也不会进行通信,而只是简单地相应上层的请求。

2.1 连接管理与安全性

每个客户端连接都会在服务器进程中拥有一个线程(为什么是线程?)。这个连接的查询只会在这个单独的线程中进行,该线程只能轮流在某个 CPU 核心上运行。由于服务器会缓存线程,因此不需要为每个新建的连接创建或者销毁线程。MySQL 5.5 之后的版本还支持线程池(Thread-Pooling)插件,可以利用池中少量的线程服务大量的客户端连接。

当客户端连接到服务器上时,MySQL 服务器的连接层还会对其进行认证。认证一般基于用户名、密码和主机信息。客户端连接成功之后,希望执行 MySQL 语句时,MySQL 服务其会验证该客户端是否具有执行该语句的权限。

2.2 优化与执行

当客户端的语句通过连接层的鉴权之后,会到达核心功能层。首先,核心功能层的解析器会解析该语句,并创建内部数据结构(解析树),然后优化器对语句进行优化,包括重写查询、决定表的读取顺序,以及选择合适的索引等。

用户可以通过特殊的关键字提示(hint)优化器,影响它的决策过程。也可以请求优化器解释(explain)某条语句的查询策略(即是否命中索引等)。并且解释优化过程的各个因素(?),是用户可以知道服务器是如何进行优化决策的,并提供一个参考基准,便于用户重构查询和 schema()、修改相关配置、是应用尽可能高效运行。

优化器并不关心数据表底层使用的是什么存储引擎,但存储引擎对于优化器的查询优化是有影响的。优化器会请求存储引擎层提供容量或某个具体操作的开销信息,以及表数据的统计信息等。某些存储引擎的某种索引,可能对一些特定的查询有优化。之后的章节会详细介绍索引与 schema 的优化,这也是高性能 MySQL 的关键之一。

对于 SELECT 语句,在解析查询之前,MySQL 服务器还会先检查查询缓存(Query Cache)。如果能在查询缓存中找到对应的查询,服务器就不必在执行查询解析、优化和执行的整个过程,而是直接返回查询缓存中的结果集。(问题:如果该查询对应的数据发生了变化,如何使得查询缓存中的结果集失效,从而避免返回过期的查询结果?)