高性能 MySQL 开发实践指南

2018-01-16 1 min read DB

Executive Summary

核心观点（金字塔原理）

结论先行: MySQL 高性能开发的核心在于合理的表设计（字段精简、适度反范式）和高效的索引设计（理解 B+Tree 原理和 InnoDB 聚簇索引机制），通过执行计划分析持续优化慢查询。

支撑论点:

表设计原则：字段类型越小越好、字段少而精、适当反范式保留冗余字段、合理分库分表保留扩展能力

索引设计基于 B+Tree：叶子节点存数据减少 IO、单页 16KB 四层可存 80 亿数据、聚簇索引叶子存完整数据、辅助索引需回表

主键必须有且顺序增长：强烈建议 int/bigint 自增主键，避免 UUID/MD5 等无序散列值导致页分裂

SWOT 分析

维度	分析
S 优势	B+Tree 索引 IO 效率高；InnoDB 支持事务和行锁；成熟稳定的生态
W 劣势	VARCHAR 易产生碎片；辅助索引需回表查询；执行计划基于统计估算
O 机会	读写分离架构；分库分表水平扩展；缓存表异构优化热点查询
T 威胁	字段过多导致 IO 低效；索引设计不当导致全表扫描；无序主键导致页分裂

适用场景

需要事务支持的 OLTP 业务系统
高并发读写的互联网应用
需要水平扩展的大数据量场景

表设计指南

业务合理情况下通常约小约好，考虑长远性。

类型	存储占用空间
TINYINT	1Byte
SMALLINT	2Byte
MEDIUMINT	3Byte
INT	4Byte
BIGINT	8Byte
VARCHAR(n)	可变长度,支持到65535B，需要额外补充1-2字节记录长度，原数据位置更细切可变，易产生碎片，使用场景，字符串的最大长度比平均长度大很对，比如评价，字段更新少，碎片化问题不严重。
CHAR(n)	定长，支持到255B，无需额外空间，定长不易产生碎片问题。使用场景，存储固定长度数据，比如MD5值，身份证ID，经常变更数据，也不易产生碎片，对于短的列，CHAR比VARCHAR在存储上更有效率

表设计范式需要平衡
1. 没有绝对的对于错，只有适不适合
2. 高性能反范式，适当保留聚合字段，冗余字段
表设计-字段少而精
- 拆分前
  - 字段多，40多个字段甚至更多字段混在一张表中。
  - IO非常低效，返回很多无用的字段。
  - 索引不好复用
  - 耦合严重，读写，变更字段分不开，无法按照字段本身的特点做针对性的优化。
  - 体积大，单表数据大。
表设计-分库分表
- 保留充分的读写拓展能力
  - 分表
    - 分库的数据结构准备
    - 提升读写效率
  - 分库
    - 数据库写能力水平拓展
表设计-缓存表（异构表）结合业务场景使用缓存数据异构。比如，userId, orderId, poiId…等组合为一张表。

索引设计指南

B+Tree，最主要是减少IO操作。
- 平衡m叉 + 叶子节点才存储数据
  - 增大页内数据量提升预读有效性，减少磁盘IO。操作系统局部性原理。
  - 极大减少树的度，减少磁盘IO。
  - 单页16KB，两int的联合索引8B，4层可存80亿数据。
  - 叶子节点直接绑定数据，减少磁盘IO。
- 有序 + 叶子节点双向链表
  - 快速的定位，范围查询，排序
InnoDB 索引组织表
- 聚簇索引叶子节点保存完整数据
  - 如果定义了PK，则PK就是作为聚簇索引。
  - 如果没有PK，则第一个非空unique列作为聚簇索引。
  - 否则InnoDB会创建一个隐藏的row-id作为聚簇索引。
- 辅助索引叶子节点村聚簇索引的值
  - 先查通过普通索引查PK，再由PK查数据，回表操作，如果当前索引存在数据，那么是索引覆盖。
InnoDB主键设计规范
- 主键设计规范
  - 要有主键，且是顺序增长的。
  - 强烈建议使用int/bigint作为自增id作为主键
  - 避免使用 md5/uuid 等无序散列的数据作为主键
- 为什么一定要有顺序？
  - InnoDB使用B+树索引，顺序主键使新记录总是插入到索引末尾，避免页分裂（page split），写入性能更高。无序主键（如UUID）会导致随机插入，频繁触发页分裂和数据页移动，碎片化严重，降低读写性能。

查询设计指南

应用及运维相关指南

MySQL 查询处理

(7) SELECT (8) DISTINCT <select_list>
(1) FROM <left_table>
(3) <join_type> JOIN <right_type>
(2) ON <join_condition>
(4) WHERE <where_condition>
(5) GROUP BY <group_by_list>
(6) HAVING <having_condition>
(9) ORDER BY <order_by_list>
(10) LIMIT <number>

执行计划 explain

局限：
1）不考虑触发器，存储过程和自定义函数。
2）不考虑Cache。
3）不显示优化过程。
4）统计信息是估算。
最主要的优化方式：
慢查询日志 + 执行计划分析

高性能 MySQL 开发实践指南

Executive Summary

核心观点（金字塔原理）

SWOT 分析

适用场景

表设计指南

索引设计指南

查询设计指南

应用及运维相关指南

MySQL 查询处理

执行计划 explain

最新文章

GitHub Trending 技术趋势 (2026-07-15) 2026-07-15

GitHub Trending 技术趋势 (2026-07-14) 2026-07-14

GitHub Trending 技术趋势 (2026-07-13) 2026-07-13