技术解读 | MySQL分布式事务处理的问题和kunlun-storage的解决方案

KunlunBase 昆仑数据库 2023-06-06

157

导读

本文详细介绍KunlunBase金融级高可靠性技术体系中最关键的部分--- kunlun-storage 存储节点故障恢复机制。KunlunBase用户并不需要理解本文内容就可以有效地使用KunlunBase，本文内容主要是给对KunlunBase核心技术和MySQL事务处理技术感兴趣的读者参考和学习。

关键词：事务处理、故障恢复、高可用、高可靠

社区版MySQL不支持对XA事务的故障恢复，因此无法直接使用作为分布式数据库的存储节点。Kunlun-storage完善和增强了MySQL的事务恢复机制，其中最主要的是增加了对XA事务的故障恢复机制，为KunlunBase集群故障恢复机制提供了基础条件，这部分技术是KunlunBase核心技术体系的重要组成部分。

经过本文所述的对社区版MySQL事务故障处理的完善和增强，kunlun-storage组成的KunlunBase集群可以正确地处理其集群任何节点的故障，并保证在KunlunBase集群中所有提交成功的事务的ACID属性，从而助力KunlunBase达到金融级高可靠性。

本文先简介KunlunBase产品概况和技术架构，然后简介KunlunBase集群故障恢复技术。这些内容在其他文章中都有详细论述。接着介绍分布式数据库集群可能面临的故障以及如果不能有效解决的话可能造成的危害。然后介绍MySQL 事务处理的基础知识和关键技术，以及MySQL故障处理和事务恢复技术。然后重点介绍MySQL在XA事务处理方面的一系列缺陷和漏洞以及KunlunBase如何解决这些问题。

本文作者赵伟曾在2021年2月的FOSDEM上做过本人内容的技术分享，受到了国内外MySQL社区的广泛关注。也曾在2023年5月我们泽拓科技在北京举办的线下meetup中以中文再次讲解本文内容。

1 KunlunBase概况

泽拓科技的KunlunBase（也叫做Klustron）一个分布式关系数据库系统，支持OLTP和OLAP混合负载(HTAP)，支持不停服的水平弹性伸缩，可以随时按需扩缩容；支持金融级高可靠性，可以在集群节点和网络故障情况下正常工作不丢失或者损坏数据，并持续提供正常服务；KunlunBase具有完备的数据安全机制，支持多粒度访问控制，全链路加密传输数据，以及数据文件和日志文件加密等功能；

KunlunBase兼容MySQL和PostgreSQL的SQL语法和连接协议，绝大多数使用MySQL和PostgreSQL数据库的应用软件和web程序无需修改即可使用KunlunBase。

应用软件开发者使用KunlunBase开发应用系统与使用MySQL或者PostgreSQL的用法完全相同 --- 他们完全不需要考虑数据在KunlunBase 分布式数据库集群中如何拆分存储和分布，也不需要担心一个事务写入多个存储集群的情况下，如何可靠地提交事务，如何执行获取多个存储集群上的数据来执行一个SQL查询语句 --- 所有这些技术细节都由KunlunBase处理，确保数据库事务的ACID属性，并且高效地从目标数据所在的若干个存储集群获取目标数据来执行任意复杂度的SQL查询。这是KunlunBase对应用开发团队来说显著优于应用层分库分表或者使用分库分表中间件的优势。