一名开发者眼中的TiDB与MySQL选择.pdf

sg1234

143

10页

0次

2024-04-16

10墨值下载

一名开发者眼中的TiDB与MySQL选择



原创数据库架构选型

TiDB长期霸榜国产数据库第一名，社区活跃人气旺盛。作为TiDB其中的一个粉丝，我把近年的学习调研

实践归纳如下，TiDB是一款通用性的数据解决方案，任何数据场景都可以使用它来解决问题，所以它与

所有市场上所有的数据库产品多多少少存在直接上的或者间接上的竞争关系。

那么市场竞争上谁是TiDB的第一梯队竞争对手,本人认为是MySQL是其中一个，当然也可以是Oracle、

DB2等等，主要是MySQL在中国深入人心，工程师信手拿来就能使用。

TiDB与MySQL的对比

有些人直接称TiDB为大号的MySQL，其实不对，为了工程师像使用MySQL使用TiDB，TiDB在接口层下

了大量的功夫，在语法、表名、引用甚至元数据方面尽量与MySQL贴合，但是每个语句背后执行的都是

不同的数据流程和服务流向。

类型上比较，MySQL是纯粹单机式数据库，TiDB是分布式数据库，TiDB可以方便自由增加节点扩展存

算能力，而MySQL增加节点增强性能，必须通过定向策略，例如中间件路由或者读写分离的方式，显得

呆滞固化。

引擎上比较，MySQL有myisam、innodb、memory等引擎，也可以通过插件支持更多的引擎例如

rocksdb，HandlerSocket等等，而TiDB虽然只有两个引擎,但是却能应对所有的应用场景。

架构上比较，MySQL是偏紧密耦合，分为三层分别是接口层、服务层、存储层，接口层负责请求处理、

授权认证、安全，服务层负责查询解析、分析、优化、缓存、系统内置函数，存储层负责数据的存储和

处理，统一体现在一个服务进程上。TiDB则是松散耦合型，把数据库的关键组件抽象，根据本身分布式

的特性，分别是计算层、存储层、协调层。

TiDB计算层类似MySQL接口层，负责负责接收 SQL 请求，处理 SQL 相关的逻辑，并通过协调层找

到存储计算所需存储层数据的地址，与存储层交互获取数据，最终返回结果。

TiDB存储层负责存储数据，数据的存储容量没有上限，存储层上同一份数据一般有3个副本，满足

高并发需求。协调层会对存储层中的数据做出负载均衡的处理。

TiDB协调层负责集群的管理模块，经常干的事情有3个，一个是集群的元信息，一个是对存储层的

数据进行调度和负载均衡，一个分配全局唯一且递增的事务 ID。

数据处理技术上，MySQL是B+树的组织存储结构，B+树适合读多写少，如果写多了，写的影响动作主

要是插入、删除，会导致全局的平衡树下面的页频繁分裂或者合并，直接影响性能，影响读放大。TiDB

是LSM树的组织存储结构,擅长写多读少，如果读多了，在内存扫描不到数据，就会去硬盘里面去寻找无

序的sst文件，所以数据越多越大就会读放大。

处理存储上，MySQL类似微内核，微内核架构由核心服务和插件模块组成，核心服务负责请求后处理机

制流程并进行优化，插件模块主要用来放置置处理存储的引擎，引擎决定性能上限，微内核的插件式对

开发者友好，可以自由扩展，所以MySQL派生了infobright、MyRocks等第三方相关引擎，TiDB的核心

服务分散在tidb模块和pd模块里面，两者协同工作构成请求解析、处理、优化及其它服务功能， tikv模

块和tiflash模块则是引擎。无论是顺序读写还是随机读写，核心服务协同背端的引擎工作串成整个数据

全链条过程，MySQL是单机单进程的内部去完成这个过程的，而TiDB是分布式多进程完成这个过程的。

产品方向上比较，MySQL默认innodb，擅长OLTP的业务场景，同时MySQL可以插件组装各式引擎，换

言之MySQL是一个通用型的数据库产品支持所有的业务场景。而TiDB默认悲观事务，同样是以OLTP为

重，同样是一个通用型的数据库产品。但是两者是不一样的，由于MySQL是单机型的结构，如果它要扩

展，只能通过数据库中间件路由划分，如果数据满了需要停机停服，重新进行数据的割分。

TiDB对业务无侵入性，扩展非常简单，发展至今安装与维护都非常成熟，通过Tiup就可以就可以对分布

式集群进行组装维护的相关操作，并且支持在线升级，无缝迁移。

总结，TiDB与MySQL没有对比性，他们不是同一类的数据产品，但是从数据库的特性和市场方向上出

发，他们又有了对比的维度指标。事实上，TiDB努力向MySQL学习，甚至还聘请了innodb的内核开发

工程师，努力调整TiDB的底盘，让TiDB从内向外都像MySQL。

评论