
Cetus是北京网易乐得DBA团队和SA团队联合打造的一款MySQL数据库中间件。Cetus具有读写分离版本和分库版本,已经部署在网易乐得部门众多线上MySQL集群,性能和稳定性均表现良好。其开源地为:https://github.com/Lede-Inc/cetus,欢迎star关注。
本文主要对Cetus的负载均衡的策略及性能优化进行介绍。
本文所讨论的负载均衡,指的是读流量的负载均衡,即读流量如何分配到后端同一MySQL集群内的各个DB。
Cetus的负载均衡策略,主要分为两部分:
1 主库和从库之间读流量的负载策略;
2 从库之间的读流量的负载策略。具体实现时候,流量的分配单位与Atlas等中间件也略有不同,进行了性能优化。下面章节将依次详细介绍。
1 主从库之间的读流量负载策略
默认情况下,非事务中、未通过注释强制路由主库或未使用锁的读流量会优先路由到从库,各个从库之间负载均衡。只有当从库都不可用时,读流量才会路由到主库。
有些业务场景下,主库可以分担部分读流量,这时就涉及到读流量在主库和从库上配置负载策略了。Cetus中,可以通过配置参数read-master-percentage
来指定默认的读流量路由到主库的百分比,该参数的取值范围是[0, 100]。该值默认为0,即所有读流量会优先路由从库,所有从库均不可用时,才会路由主库;如果该参数设置为100时,则所有读流量都会路由到主库;如果该值设置为(0, 100)时,则会按照设置的比例进行路由。需要注意的是,该值表示的是主库和所有从库的比例。
2 从库之间的读流量负载策略
路由到从库的流量,会在各个从库之间进行负载均衡。目前Cetus各个从库之间的读流量负载策略仅支持轮询(RR)方式。
在流量分配方面,Cetus也进行了优化。一些MySQL数据库中间件(例如Atlas)是基于SQL的维度做负载均衡的,即不会考虑SQL是否是同一个连接还是不同连接发送来的,中间件依次将接收到的SQL按照策略发往后端的数据库。

在实际使用中发现,长连接的场景下,该策略会造成大量的连接切换,从而造成session级变量的频繁调整,影响SQL执行效率。因此,Cetus对其进行了优化,并非完全按照SQL的维度做负载均衡。Cetus考虑了同一个连接连续发送SQL请求的情况,不会立即将当前SQL使用完的Cetus与MySQL的连接放回连接池复用,而是持有短暂(256毫秒)时间,以期后续仍有SQL执行,从而避免了session级变量的调整,大大增加了SQL执行的效率。

长连接场景下,对优化前后的Cetus进行了简单测试。通过测试发现,通过优化后的Cetus针对长连场景下的读流量的吞吐量有了明显提升。下面是在docker环境下的简单测试对比。
| 序号 | 节点 | 角色 |
|---|---|---|
| 1 | docker: 172.17.0.2 | cetus-release |
| 2 | docker: 172.17.0.3 | mysql5.7-master |
| 3 | docker: 172.17.0.4 | mysql5.7-slave |
| 4 | docker: 172.17.0.5 | mysql5.7-slave |
| 5 | docker: 172.17.0.6 | sysbench1.1 |
为了防止IO过高,简单改造了sysbench发送的SQL,限制了返回的结果集大小。禁用事务和prepare的情况下,采用100个线程每次测试60s,连续测试5次,结果如下:
| 序号 | 优化前QPS | 优化后QPS |
|---|---|---|
| 1 | 3891.20 | 4300.61 |
| 2 | 3686.94 | 4983.47 |
| 3 | 4166.35 | 5002.94 |
| 4 | 3674.55 | 5219.55 |
| 5 | 3371.53 | 5380.14 |
| AVG | 3758.114 | 4977.342 |
由于本机docker性能较差,且sysbench模拟测试的语句较为简单,不涉及session变量的切换,因此对比效果不甚明显,本次测试性能仅提升30%左右。长连业务场景下,可能性能优化会更加明显。
3 读流量的路由策略总结
在存在至少1个可用从库的情况下,影响查询语句的路由策略的因素主要有:
1 事务中的查询
2
select...for update
或select ... lock in share mode3 Cetus设置参数
master-preferred=true
所有流量默认全部路由主库4 Cetus设置参数
read-master-percentage
控制主从读流量负载5 使用注释
/*#mode=READWRITE*/
或/*#mode=READONLY*/
默认情况下,读流量会优先路由到从库,从库之间按照轮询策略在各个从库之间做负载均衡;一旦所有从库均不可用,会路由到主库上。目前Cetus的各个从库暂不支持按照权重做负载。
对于第1、2、3点,Cetus会将查询语句直接路由主库。
对于第4点,如果设置read-master-percentage=100
,所有的查询流量均路由到主库;如果设置read-master-percentage=[0, 100)
,Cetus会将读流量按照该比例路由到主库和从库。注意,这里的从库指的是全部的从库,即该比例指的是主库和全部从库的比例。
对于第5点,如果使用注释/*#mode=READWRITE*/
,读流量会路由到主库;如果使用注释/*#mode=READONLY*/
读流量会路由从库,如果所有从库均不可用时才会路由到主库。
上面的各个因素的优先级,注释的优先级最高,其次是参数master-preferred
,最后是参数read-master-percentage
。
Cetus中间件开源地址
github地址:https://github.com/Lede-Inc/cetus/blob/master/doc/cetus-quick-try.md,欢迎加star关注
社群
技术专家在线及时反馈
cetus开源qq群号: 521824702
cetus开源微信群:扫描网易DBA小助手加入

往期精彩文章
__________________________
欢迎分享

网易乐得DBA组负责网易乐得电商、网易邮箱、网易技术部数据库日常运维,负责数据库私有云平台的开发和维护,负责数据库及数据库中间件的开发和测试等,分享最前沿实用数据库干货,关注网易乐得DBA,精修数据库功底。





