1 .一种分布式数据库的查询优化方法,其特征在于,所述分布式数据库包括主节点和
处理节点,其中所述处理节点包括至少一个第一节点和至少一个第二节点,所述方法应用
于所述主节点,所述方法包括:
在接收到目标查询请求后,对至少一个所述第一节点上关于外表的第一节点数据进行
广播,所述第一节点数据携带数据标识信息,使得至少一个所述第二节点在接收到所述第
一节点数据后,将所述第二节点上关于内表的第二节点数据与所述第一节点数据进行内连
接,得到内连接数据,并基于所述数据标识信息对所述内连接数据进行去重;
接收各个所述第二节点发送的去重后的内连接数据,并根据所述去重后的内连接数据
得到数据查询结果;
其中,所述数据标识信息至少包括以下信息之一:所述第一节点的节点ID、行号和连接
键。
2 .根据权利要求1所述的方法,其特征在于,在对至少一个所述第一节点上关于外表的
第一节点数据进行广播之前,还包括:
根据所述分布式数据库的内表数据量和外表数据量之间的差值情况,确定所述分布式
数据库是否需要进行查询执行优化;
基于需要进行查询执行优化的确定结果,在接收到目标查询请求后,执行对至少一个
所述第一节点上关于外表的第一节点数据进行广播的步骤。
3 .根据权利要求2所述的方法,其特征在于,所述根据所述分布式数据库的内表数据量
和外表数据量之间的差值情况,确定所述分布式数据库是否需要进行查询执行优化,包括:
基于所述分布式数据库的数据收集信息,检测内表数据量是否大于外表数据量,且所
述内表数据量与所述外表数据量之间的差值达到预设阈值;
若内表数据量是否大于外表数据量且所述差值达到预设阈值,则确定所述分布式数据
库需要进行查询执行优化。
4 .根据权利要求1所述的方法,其特征在于,所述根据所述去重后的内连接数据得到数
据查询结果,包括:
根据所述数据标识信息对所述去重后的内连接数据再次进行去重,以得到数据查询结
果。
5 .根据权利要求1‑4任一项所述的方法,其特征在于,所述目标查询请求为携带目标查
询语句的请求;其中,所述目标查询语句为半连接查询语句,或者子查询转半连接的查询语
句。
6 .一种分布式数据库的查询优化方法,其特征在于,所述分布式数据库包括主节点和
处理节点,其中所述处理节点包括至少一个第一节点和至少一个第二节点,所述方法应用
于所述第二节点,所述方法包括:
接收所述分布式数据库中广播的至少一个所述第一节点上关于外表的第一节点数据,
其中所述第一节点数据是所述主节点接收到目标查询请求后广播的,或者所述主节点接收
到目标查询请求后指示所述第一节点广播的;
将所述第二节点上关于内表的第二节点数据与所述第一节点数据进行内连接,得到内
连接数据,并基于所述第一节点数据中携带的数据标识信息对所述内连接数据进行去重,
使得所述主节点接收去重后的内连接数据,并根据所述去重后的内连接数据得到数据查询
权 利 要 求 书
1/2 页
2
评论