1 .一种分布式数据库的数据量统计方法,所述分布式数据库包括主节点以及多个计算
节点,并且所述数据量统计方法包括:
所述多个计算节点获取由所述主节点下发的用于统计待统计表的数据量的分片查询
计划;所述分片查询计划为每一所述待统计表指定一个求和节点,所述求和节点为所述多
个计算节点中的一个;
所述多个计算节点执行各自的所述分片查询计划,以完成查询流程和汇总流程;其中
所述查询流程包括:所述多个计算节点查询自身存有的每一所述待统计表的表标识和
数据量,并根据所述待统计表的表标识将查询出的所述待统计表的表标识和数据量发送给
对应的所述求和节点;
所述汇总流程包括:所述求和节点汇总从所述多个计算节点获取的数据量,并向所述
主节点发送汇总结果,所述汇总结果包括所述求和节点对应的所述待统计表的表标识和数
据量总和。
2.根据权利要求1所述的分布式数据库的数据量统计方法,其中
所述求和节点汇总从所述多个计算节点获取的数据量的步骤包括:
所述求和节点根据所述表标识将从所述多个计算节点获取的数据量分别汇总,并分别
计算出与每一所述表标识对应的所述待统计表的总数据量。
3 .根据权利要求1所述的分布式数据库的数据量统计方法,其中
所述多个计算节点查询自身存有的每一所述待统计表的表标识和数据量的步骤包括:
所述多个计算节点分别顺序扫描各自的元数据表,获取所述元数据表中预存的所述待
统计表的表标识和数据量。
4 .根据权利要求1所述的分布式数据库的数据量统计方法,其中
所述根据所述待统计表的表标识将查询出的所述待统计表的表标识和数据量发送给
对应的所述求和节点的步骤包括:
根据所述待统计表的表标识,采用预设算法确定所述待统计表对应的所述求和节点,
并将查询出的所述待统计表的表标识和数据量发送给对应的所述求和节点。
5 .根据权利要求1所述的分布式数据库的数据量统计方法,其中
在所述多个计算节点获取由所述主节点下发的用于统计待统计表的数据量的分片查
询计划的步骤之前,还包括:
所述主节点获取数据量查询指令后,根据所述数据量查询指令生成分布式查询计划,
将所述分布式查询计划拆分成多个所述分片查询计划并下发给所述多个计算节点。
6 .根据权利要求5所述的分布式数据库的数据量统计方法,其中
所述数据量查询指令为SQL语句;
所述根据所述数据量查询指令生成分布式查询计划的步骤包括:
对所述数据量查询指令进行SQL解析和查询优化生成所述分布式查询计划。
7 .根据权利要求5所述的分布式数据库的数据量统计方法,其中
所述待统计表包括所述分布式数据库中存有的全部数据表。
8.根据权利要求7所述的分布式数据库的数据量统计方法,其中
在所述向所述主节点发送汇总结果的步骤之后,还包括:
所述主节点接收各所述求和节点发送的所述汇总结果,并将所述汇总结果整合发送给
权 利 要 求 书
1/2 页
2
评论