暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

人大金仓KingbaseES-JDBC读写分离之集群监控线程的多次重试

原创 数据猿 2023-12-19
235


关键字:

KingbaseES、JDBC、读写分离、人大金仓、KingbaseES

环境要求

KESV9R1版本数据库、IDEA软件

背景描述

KES的JDBC读写分离集群监控线程,在创建检测连接时,会更新连接的版本,版本更新会导致旧版本的指令执行失效。每当出现线程运行异常,检测连接都会被关闭。然而,当网络延迟高时,监控线程频繁会频繁出现因数据获取超时,导致的连接关闭与重建,不仅造成了资源的浪费,也会使业务代码出现频繁报错的异常。上述问题的解决方法之一,是新增集群监控线程的多次重试功能,延长集群运行状态的判断时间。

异常信息

在KESV9R1版本数据库中,可以发现,底层出现数据获取超时的异常类型是socketTimeoutException。该异常被上层捕获,并包装为IOException。监控线程中捕获到的异常类型是SQLException,其详细信息如下图所示,底层的异常信息为read timed out。

网络超时后SQLException的具体内容

多次重试功能的具体设计及实现

集群监控线程的多次重试功能,可以通过新增标志变量来实现。在集群监控线程所在的ConnectionMangerV2类中,新增monitor_wait变量,该值可从Property中获取默认值,也可通过连接参数传递,并可用于识别多次重试功能是否启动。

下图展示了集群监控线程的多次重试功能的具体设计,在运行正常的检测过程中,monitor_wait等于初始值时,表示未启动多次重试,此时连接重建时不更新连接版本。当出现异常时,检测monitor_wait变量的值:大于0表示可以启动多次重试功能;等于0表示不可启动多次重试功能,或已经达到重试次数上限。此外,正常检测结束、其他异常发生和重试次数为0等情况,都需要重置monitor_wait为初始值,以保证多次重试功能的正常使用。

集群监控线程的多次重试功能设计图

下图展示了基于上述设计思路,完成的代码编写工作的主要代码详情。Monitor_wait的默认值是5,表示可以进行5次重试。

参考文档:

「喜欢这篇文章,您的关注和赞赏是给作者最好的鼓励」
关注作者
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文章的来源(墨天轮),文章链接,文章作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论