书海网短评:
“只要你不敢以MySQL专家自诩,又岂敢错过这本神书?”“一言以蔽之,写得好,编排得好,需要参考时容易到爆!”“我可是从头到尾看了一遍上一版,可还是毫不犹豫拿起了这本《高性能MySQL(第3版)》
“只要你不敢以MySQL专家自诩,又岂敢错过这本神书?”
“一言以蔽之,写得好,编排得好,需要参考时容易到爆!”
“我可是从头到尾看了一遍上一版,可还是毫不犹豫拿起了这本《高性能MySQL(第3版)》,而且看完后一点都不后悔……”
◎学习MySQL新特性,包括存储引擎、分区数据库、触发器和视图
◎实现复制的改进、高可用和集群
◎获得在云端运行MySQL的高性能
◎优化高级查询特性,如全文索引
◎从现代的多核CPU和固态硬盘中获益
◎探索备份和恢复的策略,包括新的在线备份工具
《高性能MySQL(第3版)》是MySQL领域的经典之作,拥有广泛的影响力。第3版更新了大量的内容,不但涵盖了MySQL5.5版本的新特性,也讲述了关于固态盘、高可扩展性设计和云计算环境下的数据库相关的新内容,原有的基准测试和性能优化部分也做了大量的扩展和补充。《高性能MySQL(第3版)》共分为16章和6个附录,内容涵盖MySQL架构和历史,基准测试和性能剖析,数据库软硬件性能优化,复制、备份和恢复,高可用与高可扩展性,以及云端的MySQL和MySQL相关工具等方面的内容。每一章都是相对独立的主题,读者可以有选择性地单独阅读。
《高性能MySQL(第3版)》不但适合数据库管理员(DBA)阅读,也适合开发人员参考学习。不管是数据库新手还是专家,相信都能从《高性能MySQL(第3版)》有所收获。
BaronSchwartz是一位软件工程师,居住在弗吉尼亚州的Charlottesville,网络常用名是Xaprb,这是按照QWERTY键盘的顺序在Dvorak键盘上打出来的名字。在不忙于解决有趣的编程挑战时,Baron会和他的妻子Lynn以及小狗Carbon一起享受闲暇的时光。他有一个软件工程方面的博客。
PeterZaitsev曾经是MySQLAB公司高性能组的经理,目前在运作mysqlperformanceblog.com网站。他擅长于帮助那些每天有数以百万计访问量的网站的管理员解决问题,这些网站通常需要几百台机器来处理TB级的数据。他常常为了解决一个问题而不停地升级硬件和软件(比如查询优化)。Peter还经常在各种会议上演讲。
VadimTkachenko曾经是MySQLAB公司的性能工程师。作为一名在多线程编程和同步方面的专家,他的主要工作是基准测试、性能剖析,以及找出系统的性能瓶颈。他还在性能监控和调优方面做了一些工作,使得MySQL在多核机器上有更好的可扩展性。
译者简介
宁海元有超过十年的数据库管理经验,从最初的SQLServer2000到Oracle再到MySQL,擅长数据库高可用架构、性能优化和故障诊断。2007年加入*,带领*DBA团队完成了数据库的垂直拆分、水平拆分,迁移到MySQL体系等主要工作,为*业务的快速增长提供支撑。目前专注于无线数据领域。网络常用名NinGoo,
周振兴毕业于北京师范大学数学系,2009年加入*数据库团队,负责MySQL运维管理工作,有丰富的MySQL性能优化、Troubleshooting经验,对MySQL主要模块的实现和原理有深入的研究,经历了*MySQL实例从30到3000的发展,对系统架构、高可用环境规划都有深入理解。
彭立勋2010年大学毕业后加入********运维部。作为一名MySQLDBA,在运维MySQL的过程中对MySQL和InnoDB的一些功能和缺陷进行了补充,编写了多主复制和数据闪回等补丁。目前在阿里集团核心系统研发部数据库组,专注于MySQL数据库相关的开发工作。后来一些补丁被MySQL之父Mony看中,多主复制、线程内存监控等补丁被合并到了MariaDB10.0版本,本人也因此成为MariaDB提交组(Maria-captains)成员。
翟卫祥毕业于武汉大学,研究生阶段从事数据库相关研究。毕业后就职数据库技术团队至今,主要负责阿里内部MySQL代码分支维护,包括MySQLBugFix及新特性开发。对MySQL内核有一定的研究。
刘辉2008年毕业于西安电子科技大学计算机系,硕士学位。2011年加入数据库技术团队,花名希羽,MySQL内核开发工程师。
每一章均别具匠心,力求理论与实践的精确平衡,且布满无价之宝,有时甚至越过MySQL舞台,完全适用于任一数据库。其中第二章“MySQL基准测试”及第3章“服务器性能剖析”是非常必要的基础,推荐提前阅读。
纵观《高性能MySQL(第3版)》,作者推荐的工具、实战案例及经验过的诊断技术,可大大提高你的性能急救技能,以及加深对MySQL本质的理解。然而,《高性能MySQL(第3版)》值得推崇的,还是其在探讨性能的同时,将数据库结构的客观方面纳入思考,这是其他书里难以看到的。此外,增补的MySQL高可用性及云特性,也让人更加欣喜。
相信不少人会因为找不到某些书中引用的资料或工具而苦恼,但从《高性能MySQL(第3版)》中按图索骥,会发现这些东西正是作者对MySQL社区的杰出贡献,也就是说,你可以直接用这些工具!
很多年前我就是这《高性能MySQL(第3版)》的“粉丝”了,这是一本伟大的书,第三版尤其如此。这些世界级的专家不仅仅分享他们的专业知识,也花了很多时间来更新和添加新的章节,且都是高品质的内容。《高性能MySQL(第3版)》有大量关于如何获得MySQL高性能的细节信息,并且关注的是提升性能的过程,而不仅仅是描述事实结果和琐碎的细枝末节。这《高性能MySQL(第3版)》将告诉读者如何将事情做得更好,不管MySQL在不同版本中的行为有多么大的改变。
毫无疑问,《高性能MySQL(第3版)》的作者是有资格来写这么一《高性能MySQL(第3版)》的人,他们经验丰富,有合理的方法,关注效率,并且精益求精。说到经验丰富,《高性能MySQL(第3版)》的作者已经在MySQL性能领域工作多年,从MySQL还没有什么可扩展性和可测量性的时代,直到现在这些方面已经有了长足的进步。而说到合理的方法,他们简直把这件事情当成了科学,首先定义需要解决的问题,然后通过合理的猜测和精确的测量来解决问题。
我对作者在效率方面的关注尤其印象深刻。作为顾问,他们时间宝贵。客户是按照他们的时间付费的,所以都希望能更快地解决问题。所以《高性能MySQL(第3版)》作者定义了一整套的流程,开发了很多的工具,让事情变得正确和高效。在《高性能MySQL(第3版)》中,作者详细描述了这些流程,并且发布了工具的源代码。
最后,《高性能MySQL(第3版)》作者在工作上一直精益求精。比如从吞吐量到响应时间的关注,致力于了解MySQL在新硬件上的性能表现,追求新的技能如排队理论对性能的影响,等等。我相信《高性能MySQL(第3版)》预示了MySQL的光明前景。MySQL已经支持高要求的工作负载,《高性能MySQL(第3版)》作者也在努力提升MySQL社区内对性能的认识。同时,他们还直接为性能提升做出了贡献,包括XtraDB和XtraBackup。一直以来我从他们身上学到了不少东西,也希望读者多花点时间读读《高性能MySQL(第3版)》,一定会同样有所收益。
——MarkCallaghan,Facebook软件工程师
推荐序
前言
第1章MySQL架构与历史
1.1MySQL逻辑架构
1.1.1连接管理与安全性
1.1.2优化与执行
1.2并发控制
1.2.1读写锁
1.2.2锁粒度
1.3事务
1.3.1隔离级别
1.3.2死锁
1.3.3事务日志
1.3.4MySQL中的事务
1.4多版本并发控制
1.5MySQL的存储引擎
1.5.1InnoDB存储引擎
1.5.2MyISAM存储引擎
1.5.3MySQL内建的其他存储引擎
1.5.4第三方存储引擎
1.5.5选择合适的引擎
1.5.6转换表的引擎
1.6MySQL时间线(Timeline)
1.7MySQL的开发模式
1.8总结
第2章MySQL基准测试
2.1为什么需要基准测试
2.2基准测试的策略
2.2.1测试何种指标
2.3基准测试方法
2.3.1设计和规划基准测试
2.3.2基准测试应该运行多长时间
2.3.3获取系统性能和状态
2.3.4获得准确的测试结果
2.3.5运行基准测试并分析结果
2.3.6绘图的重要性
2.4基准测试工具
2.4.1集成式测试工具
2.4.2单组件式测试工具
2.5基准测试案例
2.5.1http_load
2.5.2MySQL基准测试套件.
2.5.3sysbench
2.5.4数据库测试套件中的dbt2TPC-C测试
2.5.5Percona的TPCC-MySQL测试工具
2.6总结
第3章服务器性能剖析
3.1性能优化简介
3.1.1通过性能剖析进行优化
3.1.2理解性能剖析
3.2对应用程序进行性能剖析
3.2.1测量PHP应用程序
3.3剖析MySQL查询
3.3.1剖析服务器负载
3.3.2剖析单条查询
3.3.3使用性能剖析
3.4诊断间歇性问题
3.4.1单条查询问题还是服务器问题
3.4.2捕获诊断数据
3.4.3一个诊断案例
3.5其他剖析工具
3.5.1使用USER_STATISTICS表
3.5.2使用strace
3.6总结
第4章Schema与数据类型优化
4.1选择优化的数据类型
4.1.1整数类型
4.1.2实数类型
4.1.3字符串类型
4.1.4日期和时间类型
4.1.5位数据类型
4.1.6选择标识符(identifier)
4.1.7特殊类型数据
4.2MySQLschema设计中的陷阱
4.3范式和反范式
4.3.1范式的优点和缺点
4.3.2反范式的优点和缺点.
4.3.3混用范式化和反范式化
4.4缓存表和汇总表
4.4.1物化视图
4.4.2计数器表
4.5加快ALTERTABLE操作的速度
4.5.1只修改.frm文件
4.5.2快速创建MyISAM索引
4.6总结
第5章创建高性能的索引
5.1索引基础
5.1.1索引的类型
5.2索引的优点
5.3高性能的索引策略
5.3.1独立的列
5.3.2前缀索引和索引选择性
5.3.3多列索引
5.3.4选择合适的索引列顺序
5.3.5聚簇索引
5.3.6覆盖索引
5.3.7使用索引扫描来做排序
5.3.8压缩(前缀压缩)索引
5.3.9冗余和重复索引
5.3.10未使用的索引
5.3.11索引和锁
5.4索引案例学习
5.4.1支持多种过滤条件
5.4.2避免多个范围条件
5.4.3优化排序
5.5维护索引和表
5.5.1找到并修复损坏的表.
5.5.2更新索引统计信息
5.5.3减少索引和数据的碎片
5.6总结
第6章查询性能优化
6.1为什么查询速度会慢
6.2慢查询基础:优化数据访问
6.2.1是否向服务器请求了不需要的数据
6.2.2MySQL是否在扫描额外的记录
6.3重构查询的方式
6.3.1一个复杂查询还是多个简单查询
6.3.2切分查询
6.3.3分解关联查询
6.4查询执行的基础
6.4.1MySQL客户端/服务器通信协议
6.4.2查询缓存
6.4.3查询优化处理
6.4.4查询执行引擎
6.4.5返回结果给客户端
6.5MySQL查询优化器的局限性
6.5.1关联子查询
6.5.2UNION的限制
6.5.3索引合并优化
6.5.4等值传递
6.5.5并行执行
6.5.6哈希关联
6.5.7松散索引扫描
6.5.8最大值和最小值优化.
6.5.9在同一个表上查询和更新
6.6查询优化器的提示(hint)
6.7优化特定类型的查询
6.7.1优化COUNT()查询
6.7.2优化关联查询
6.7.3优化子查询
6.7.4优化GROUPBY和DISTINCT
6.7.5优化LIMIT分页
6.7.6优化SQL_CALC_FOUND_ROWS
6.7.7优化UNION查询
6.7.8静态查询分析
6.7.9使用用户自定义变量.
6.8案例学习
6.8.1使用MySQL构建一个队列表
6.8.2计算两点之间的距离.
6.8.3使用用户自定义函数.
6.9总结
第7章MySQL高级特性
7.1分区表
7.1.1分区表的原理
7.1.2分区表的类型
7.1.3如何使用分区表
7.1.4什么情况下会出问题.
7.1.5查询优化
7.1.6合并表
7.2视图
7.2.1可更新视图
7.2.2视图对性能的影响
7.2.3视图的限制
7.3外键约束
7.4在MySQL内部存储代码
7.4.1存储过程和函数
7.4.2触发器
7.4.3事件
7.4.4在存储程序中保留注释
7.5游标
7.6绑定变量
7.6.1绑定变量的优化
7.6.2SQL接口的绑定变量
7.6.3绑定变量的限制
7.7用户自定义函数
7.8插件
7.9字符集和校对
7.9.1MySQL如何使用字符集
7.9.2选择字符集和校对规则
7.9.3字符集和校对规则如何影响查询
7.10全文索引
7.10.1自然语言的全文索引
7.10.2布尔全文索引
7.10.3MySQL5.1中全文索引的变化
7.10.4全文索引的限制和替代方案
7.10.5全文索引的配置和优化
7.11分布式(XA)事务
7.11.1内部XA事务
7.11.2外部XA事务
7.12查询缓存
7.12.1MySQL如何判断缓存命中
7.12.2查询缓存如何使用内存
7.12.3什么情况下查询缓存能发挥作用
7.12.4如何配置和维护查询缓存
7.12.5InnoDB和查询缓存.
7.12.6通用查询缓存优化
7.12.7查询缓存的替代方案
7.13总结
第8章优化服务器设置
8.1MySQL配置的工作原理
8.1.1语法、作用域和动态性
8.1.2设置变量的副作用
8.1.3入门
8.1.4通过基准测试迭代优化
8.2什么不该做
8.3创建MySQL配置文件
8.3.1检查MySQL服务器状态变量
8.4配置内存使用
8.4.1MySQL可以使用多少内存?
8.4.2每个连接需要的内存.
8.4.3为操作系统保留内存.
8.4.4为缓存分配内存
8.4.5InnoDB缓冲池(BufferPool)
8.4.6MyISAM键缓存(KeyCaches)
8.4.7线程缓存
8.4.8表缓存(TableCache)
8.4.9InnoDB数据字典(DataDictionary)
8.5配置MySQL的I/O行为
8.5.1InnoDBI/O配置
8.5.2MyISAM的I/O配置.
8.6配置MySQL并发.
8.6.1InnoDB并发配置
8.6.2MyISAM并发配置
8.7基于工作负载的配置
8.7.1优化BLOB和TEXT的场景
8.7.2优化排序(Filesorts).
8.8完成基本配置
8.9安全和稳定的设置
8.10高级InnoDB设置
8.11总结
第9章操作系统和硬件优化
9.1什么限制了MySQL的性能
9.2如何为MySQL选择CPU
9.2.1哪个更好:更快的CPU还是更多的CPU
9.2.2CPU架构
9.2.3扩展到多个CPU和核心
9.3平衡内存和磁盘资源
9.3.1随机I/O和顺序I/O
9.3.2缓存,读和写
9.3.3工作集是什么
9.3.4找到有效的内存/磁盘比例
9.3.5选择硬盘
9.4固态存储
9.4.1闪存概述
9.4.2闪存技术
9.4.3闪存的基准测试
9.4.4固态硬盘驱动器(SSD)
9.4.5PCIe存储设备
9.4.6其他类型的固态存储.
9.4.7什么时候应该使用闪存
9.4.8使用Flashcache
9.4.9优化固态存储上的MySQL
9.5为备库选择硬件
9.6RAID性能优化
9.6.1RAID的故障转移、恢复和镜像
9.6.2平衡硬件RAID和软件RAID
9.6.3RAID配置和缓存
9.7SAN和NAS
9.7.1SAN基准测试
9.7.2使用基于NFS或SMB的SAN
9.7.3MySQL在SAN上的性能
9.7.4应该用SAN吗
9.8使用多磁盘卷
9.9网络配置
9.10选择操作系统
9.11选择文件系统
9.12选择磁盘队列调度策略
9.13线程
9.14内存交换区
9.15操作系统状态
9.15.1如何阅读vmstat的输出
9.15.2如何阅读iostat的输出
9.15.3其他有用的工具
9.15.4CPU密集型的机器
9.15.5I/O密集型的机器
9.15.6发生内存交换的机器
9.15.7空闲的机器
9.16总结
第10章复制
10.1复制概述
10.1.1复制解决的问题
10.1.2复制如何工作
10.2配置复制
10.2.1创建复制账号
10.2.2配置主库和备库
10.2.3启动复制
10.2.4从另一个服务器开始复制
10.2.5推荐的复制配置
10.3复制的原理
10.3.1基于语句的复制
10.3.2基于行的复制
10.3.3基于行或基于语句:哪种更优
10.3.4复制文件
10.3.5发送复制事件到其他备库
10.3.6复制过滤器
10.4复制拓扑
10.4.1一主库多备库
10.4.2主动-主动模式下的主-主复制
10.4.3主动-被动模式下的主-主复制
10.4.4拥有备库的主-主结构
10.4.5环形复制
10.4.6主库、分发主库以及备库
10.4.7树或金字塔形
10.4.8定制的复制方案
10.5复制和容量规划
10.5.1为什么复制无法扩展写操作
10.5.2备库什么时候开始延迟
10.5.3规划冗余容量
10.6复制管理和维护
10.6.1监控复制
10.6.2测量备库延迟
10.6.3确定主备是否一致
10.6.4从主库重新同步备库
10.6.5改变主库
10.6.6在一个主-主配置中交换角色
10.7复制的问题和解决方案
10.7.1数据损坏或丢失的错误
10.7.2使用非事务型表
10.7.3混合事务型和非事务型表
10.7.4不确定语句
10.7.5主库和备库使用不同的存储引擎
10.7.6备库发生数据改变
10.7.7不唯一的服务器ID.
10.7.8未定义的服务器ID.
10.7.9对未复制数据的依赖性
10.7.10丢失的临时表
10.7.11不复制所有的更新.
10.7.12InnoDB加锁读引起的锁争用
10.7.13在主-主复制结构中写入两台主库
10.7.14过大的复制延迟
10.7.15来自主库的过大的包
10.7.16受限制的复制带宽.
10.7.17磁盘空间不足
10.7.18复制的局限性
10.8复制有多快
10.9MySQL复制的高级特性
10.10其他复制技术
10.11总结
第11章可扩展的MySQL
11.1什么是可扩展性
11.1.1正式的可扩展性定义
11.2扩展MySQL
11.2.1规划可扩展性
11.2.2为扩展赢得时间
11.2.3向上扩展
11.2.4向外扩展
11.2.5通过多实例扩展
11.2.6通过集群扩展
11.2.7向内扩展
11.3负载均衡
11.3.1直接连接
11.3.2引入中间件
11.3.3一主多备间的负载均衡
11.4总结
第12章高可用性
12.1什么是高可用性
12.2导致宕机的原因
12.3如何实现高可用性
12.3.1提升平均失效时间(MTBF)
12.3.2降低平均恢复时间(MTTR)
12.4避免单点失效
12.4.1共享存储或磁盘复制
12.4.2MySQL同步复制
12.4.3基于复制的冗余
12.5故障转移和故障恢复
12.5.1提升备库或切换角色
12.5.2虚拟IP地址或IP接管
12.5.3中间件解决方案
12.5.4在应用中处理故障转移
12.6总结
第13章云端的MySQL
13.1云的优点、缺点和相关误解
13.2MySQL在云端的经济价值
13.3云中的MySQL的可扩展性和高可用性
13.4四种基础资源
13.5MySQL在云主机上的性能
13.5.1在云端的MySQL基准测试
13.6MySQL数据库即服务(DBaaS)
13.6.1AmazonRDS
13.6.2其他DBaaS解决方案
13.7总结
第14章应用层优化
14.1常见问题
14.2Web服务器问题
14.2.1寻找最优并发度
14.3缓存
14.3.1应用层以下的缓存
14.3.2应用层缓存
14.3.3缓存控制策略
14.3.4缓存对象分层
14.3.5预生成内容
14.3.6作为基础组件的缓存
14.3.7使用HandlerSocket和memcached
14.4拓展MySQL
14.5MySQL的替代品
14.6总结
第15章备份与恢复
15.1为什么要备份
15.2定义恢复需求
15.3设计MySQL备份方案
15.3.1在线备份还是离线备份
15.3.2逻辑备份还是物理备份
15.3.3备份什么
15.3.4存储引擎和一致性
15.4管理和备份二进制日志
15.4.1二进制日志格式
15.4.2安全地清除老的二进制日志
15.5备份数据
15.5.1生成逻辑备份
15.5.2文件系统快照
15.6从备份中恢复
15.6.1恢复物理备份
15.6.2还原逻辑备份
15.6.3基于时间点的恢复
15.6.4更高级的恢复技术
15.6.5InnoDB崩溃恢复
15.7备份和恢复工具
15.7.1MySQLEnterpriseBackup
15.7.2PerconaXtraBackup.
15.7.3mylvmbackup
15.7.4ZmandaRecoveryManager
15.7.5mydumper
15.7.6mysqldump.
15.8备份脚本化
15.9总结
第16章MySQL用户工具
16.1接口工具
16.2命令行工具集
16.3SQL实用集
16.4监测工具
16.4.1开源的监控工具
16.4.2商业监控系统
16.4.3Innotop的命令行监控
16.5总结
附录AMySQL分支与变种
附录BMySQL服务器状态
附录C大文件传输
附录DEXPLAIN
附录E锁的调试
附录F在MySQL上使用Sphinx
索引
第一个趋势,采用了InnoDBplugin的版本,在高并发的时候性能明显更好,可以说InnoDBplugin的扩展性更好。这是可以预期的结果,旧的版本在高并发时确实存在问题。第二个趋势,新的版本在单线程的时候性能比旧版本更差。一开始可能无法理解为什么会这样,仔细想想就能明白,这是一个非常简单的只读测试。新版本的SQL语法更复杂,针对复杂查询增加了很多特性和改进,这对于简单查询可能带来了更多的开销。旧版本的代码简单,对于简单的查询反而会更有利。原计划做一个更复杂的不同并发条件下的读写混合场景的测试(类似TPC—C),但要在不同版本间做到可比较基本是不可能的。一般来说,新版本在复杂场景时性能有更多的优化,尤其是高并发和大数据集的情况下。
那么该如何选择版本呢?这更多地取决于业务需求而不是技术需求。理想情况下当然是版本越新越好,当然也可以选择等到第一个bug修复版本以后再采用新的大版本。如果应用还没有上线,也可以采用即将发布的新版本,以尽可能地延迟应用上线后的升级操作。
1.7MySQL的开发模式
MySQL的开发过程和发布模型在不同的阶段有很大的变化,但目前已经基本稳定下来。在Oracle定期发布的新里程碑开发版本中,会包含即将在下一个GA版本发布的新特性。这样做是为了测试和获得反馈,请不要在生产环境使用此版本,虽然Oracle宣称每个里程碑版本的质量都是可靠的,并随时可以正式发布(到目前为止也没有任何理由去推翻这个说法)。Oracle也会定期发布实验室预览版,主要包含一些特定的需要评估的特性,这些特性并不保证会在下一个正式版本中包括进去。最终,Oracle会将稳定的特性打包发布一个新的GA版本。
MySQL依然遵循GPL开源协议,全部的源代码(除了一些商业版本的插件)都会开放给社区。Oracle似乎也理解,为社区和付费用户提供不同的版本并非明智之举。MySQLAB曾经尝试过不同版本的策略,结果导致付费用户变成了“睁眼瞎”,无法从社区的测试和反馈中获得好处。不同版本的策略并不受企业用户的欢迎,所以后来被Sun废除了。现在Oracle为付费用户单独提供了一些服务器插件,而MySQL本身还是遵循开源模式。尽管对于私有的服务器插件的发布有一些抱怨,但这只是少数的声音,并且慢慢地在平息。
……
我们写这《高性能MySQL(第3版)》不仅仅是为了满足MySQL应用开发者的需求,也是为了满足MySQL数据库管理员的需要。我们假定读者已经有了一定的MySQL基础。我们还假定读者对于系统管理、网络和类Unix的操作系统都有一些了解。
《高性能MySQL(第3版)》的第二版为读者提供了大量的信息,但没有一《高性能MySQL(第3版)》是可以涵盖一个主题的所有方面的。在第二版和第三版之间的这段时间里,我们记录了数以千计有趣的问题,其中有些是我们解决的,也有一些是我们观察到其他人解决的。当我们在规划第三版的时候发现,如果要把这些主题完全覆盖,可能三千页到五千页的篇幅都还不够,这样《高性能MySQL(第3版)》的完成就遥遥无期了。在反思这个问题后,我们意识到第二版强调的广泛的覆盖度事实上有其自身的限制,从某种意义上来说也没有引导读者如何按照MySQL的方式来思考问题。
所以第三版和第二版的关注点有很大的不同。我们虽然还是会包含很多的信息,并且会强调同样的诸如可靠性和正确性的目标,但我们也会在《高性能MySQL(第3版)》中尝试更深入的讨论:我们会指出MySQL为什么会这样做,而不是MySQL做了什么。我们会使用更多的演示和案例学习来将上述原则落地。通过这样的方式,我们希望能够尝试回到下面这样的问题:“给出MySQL的内部结构和操作,对于实际应用能带来什么帮助?为什么能有这样的帮助?如何让MySQL适合(或者不适合)特定的需求?”
最后,我们希望关于MySQL内部原理的知识能够帮助大家解决《高性能MySQL(第3版)》没有覆盖到的一些情况。我们更希望读者能培养发现新问题的洞察力,能学习和实践合理的方式来设计、维护和诊断基于MySQL的系统。
《高性能MySQL(第3版)》是如何组织的
《高性能MySQL(第3版)》涵盖了许多复杂的主题。在这里,我们将解释一下是如何将这些主题有序地组织在一起的,以便于阅读和学习。
概述
第1章是非常基础的一章,在更深入地学习之前建议先熟悉一下这部分内容。在有效地使用MySQL之前应当理解它是如何组织的。本章解释了MySQL的架构及其存储引擎的关键设计。如果读者还不太熟悉关系数据库和事务的基础知识,本章也可以带来一点帮助。如果之前已经对其他关系数据库如Oracle比较熟悉,本章也可以帮助读者了解MySQL的入门知识。本章还包括了一点MySQL的历史背景:MySQL随着时间的演进、最近的公司所有权更替,以及我们认为比较重要的内容。
打造坚实的基础
《高性能MySQL(第3版)》前几章的内容在今后使用MySQL的过程中可能会被不断地引用到,它们是非常基础的内容。
第2章讨论了基准测试的基础,例如服务器可以处理的工作负载的类型、处理特定任务的速度等。基准测试是一项至关重要的技能,可用于评估服务器在不同负载下的表现,但也要明白在什么情况下基准测试不能发挥作用。
第3章介绍了我们常用于故障诊断和服务器性能问题分析的一种面向响应时间的方法。该方法已经被证明可以解决我们曾碰到过的一些极为棘手的问题。当然也可以选择修改我们所使用的方法(实际上我们的方法也是从CaryMillsap的方法修改而来的),但无论如何,至少不能没有方法胡乱猜测。
从第4章到第6章,连续介绍了三个关于良好的数据库逻辑设计和物理设计基础的话题。第4章涵盖了不同数据类型的细节差别以及表设计的原则。第5章则展开讨论了索引,这是数据库的物理设计。对于索引的深入理解和利用是高效使用MySQL的基础,相信这一章会经常需要回头翻看。而第6章则包含了分析MySQL的查询是如何执行的,以及如何利用查询优化器的话题。该章也包含了大量常见类型查询的例子,演示了MySQL是如何做好工作的,以及如何改写查询以利用MySQL的特性。
到此为止,已经覆盖了关于数据库的基础内容:表、索引、数据和查询。第7章则在MySQL基础知识之外介绍了MySQL的高级特性是如何工作的。这章的内容包括分区、存储引擎、触发器,以及字符集。MySQL中这些特性的实现可能不同于其他数据库,可能之前读者并不清楚这些不同,因此理解它们对于性能可能会带来新的收益。
配置应用程序
接下来的两章讲述的是如何让MySQL、应用程序及硬件一起很好地工作。第8章介绍了如何配置MySQL,以便更好地利用硬件,达到更好的可靠性和鲁棒性。第9章解释了如何让操作系统和硬件工作得更好。另外也深入讨论了固态硬盘,为高可扩展性应用发挥更好的性能提供了硬件配置的建议。
上面两章都一定程度地涉及了MySQL的内部知识。这将会是一个反复出现的主题,附录中也会有相关内容可以学习到MySQL的内部是如何实现的,理解了这些知识将帮助读者更好地理解某些现象背后的原理。
作为基础设施组件的MySQL
MySQL不是存在于真空中的,而是应用整体的一个环节,因此需要考虑整个应用架构的鲁棒性。下面的章节将告诉我们该如何做到这一点。
第10章讨论了MySQL的杀手级特性:能够设置多个服务器从一台主服务器同步数据。不幸的是,复制可能也是MySQL给很多用户带来困扰的一个特性。但实际上不应该发生这样的情况,本章将告诉你如何让复制运行得更好。
第11章讨论了什么是可扩展性(这和性能不是一回事),应用和系统为什么会无法扩展,该怎么改善扩展性。如果能够正确地处理,MySQL的可扩展性是足以应付任何需求的。
第12章讲述的是和可扩展性相关但又完全不同的主题:如何保障MySQL稳定而正确地持续运行。第13章将告诉你当MySQL在云计算环境中运行时会有什么不同的事情发生。
第14章解释了什么是全方位的优化(full-stackoptimization),就是从前端到后端的整体优化,从用户体验开始直到数据库。
即使是世界上设计最好、最具可扩展性的架构,如果停电会导致彻底崩溃,无法抵御恶意攻击,解决不了应用的bug和程序员的错误,以及其他一些灾难场景,那就不是什么好的架构。第15章讨论了MySQL数据库各种备份与恢复的场景。这些策略可以帮助读者减少在各种不可抗的硬件失效时的宕机时间,保证在各种灾难下的数据最终可恢复。
其他有用的主题
在《高性能MySQL(第3版)》的最后一章以及附录中,我们探讨了一些无法明确地放到前面章节的内容,以及一些被前面多个章节引用而需要特别注意的主题。
第16章探索了一些可以帮助用户更有效地管理和监控MySQL服务器的工具,有些是开源的,也有些是商业的。
附录A介绍了近年来成长迅速的三个主要的非MySQL官方版本,其中一个是我们公司在维护的产品。知道还有其他什么是可用的选择是有价值的;很多MySQL难以解决的棘手问题在其他的变种版本中说不定就不是问题了。这三个版本中的两个(PerconaServer和MariaDB)是MySQL的完全可替换版本,所以尝试使用的成本相对来说是很低的。当然,在这里我们也需要补充一点,Oracle提供的MySQL官方版本对于大多数用户来说都能服务得很好。
附录B演示了如何检查MySQL服务器。知道如何从服务器获取状态信息是非常重要的;而了解这些状态代表的意义则更加重要。这里将覆盖SHOWINNODBSTATUS的输出结果,因此这里包含了InnoDB事务存储引擎的深入信息。在这个附录中讨论了很多InnoDB的内部信息。
附录C演示了如何高效地将大文件从一个地方复制到另外一个地方。如果要管理大量的数据,这种操作是经常都会碰到的。附录D演示了如何真正地使用并理解EXPLAIN命令。附录E演示了如何破除不同查询所请求的锁互相干扰的问题。最后,附录F介绍了Sphinx,一个基于MySQL的高性能的全文索引系统。