1 .一种数据表亲和性分析方法,其特征在于,包括:
对分布式数据库的SQL语句执行查询优化,以得到第一SQL语句;
对执行查询优化后得到的所述第一SQL语句执行格式化处理,以得到第二SQL语句;
对执行格式化处理后得到的所述第二SQL语句执行词法解析,以得到所述第二SQL语句
对应的关键Token;
根据所述关键Token,以更新所述分布式数据库中对应的各个数据表;
根据所述各个数据表的任意两张数据表中Join连接条件和/或Where选择条件出现的
频次,以分析所述任意两张数据表的亲和性高低。
2 .根据权利要求1所述的数据表亲和性分析方法,其特征在于,所述根据所述各个数据
表的任意两张数据表中Join连接条件和/或Where选择条件出现的频次,以分析所述任意两
张数据表的亲和性高低之后,还包括:
根据所述任意两张数据表的表记录数及亲和性高低,以生成所述分布式数据库的数据
分布推荐策略。
3 .根据权利要求2所述的数据表亲和性分析方法,其特征在于,所述根据所述任意两张
数据表的表记录数以及亲和性高低,以生成所述分布式数据库的数据分布推荐策略之后,
还包括:
根据所述数据分布推荐策略,对所述分布式数据库执行数据重分布。
4 .根据权利要求1、2或3所述的数据表亲和性分析方法,其特征在于,所述根据所述关
键Token,以更新所述分布式数据库中对应的各个数据表,包括:
根据所述关键Token,以更新所述分布式数据库中对应的各个数据表的表计数。
5 .一种数据表亲和性分析装置,其特征在于,包括:
查询优化模块,用于对分布式数据库的SQL语句执行查询优化,以得到第一SQL语句;
格式化模块,用于对执行查询优化后得到的所述第一SQL语句执行格式化处理,以得到
第二SQL语句;
词法解析模块,用于对执行格式化处理后得到的所述第二SQL语句执行词法解析,以得
到所述第二SQL语句对应的关键Token;
更新模块,用于根据所述关键Token,以更新所述分布式数据库中对应的各个数据表;
分析模块,用于根据所述各个数据表的任意两张数据表中Join连接条件和/或Where选
择条件出现的频次,以分析所述任意两张数据表的亲和性高低。
6 .根据权利要求5所述的数据表亲和性分析装置,其特征在于,所述根据所述各个数据
表的任意两张数据表中Join连接条件和/或Where选择条件出现的频次,以分析所述任意两
张数据表的亲和性高低之后,还包括:
根据所述任意两张数据表的表记录数及亲和性高低,以生成所述分布式数据库的数据
分布推荐策略。
7 .根据权利要求6所述的数据表亲和性分析装置,其特征在于,所述根据所述任意两张
数据表的表记录数以及亲和性高低,以生成所述分布式数据库的数据分布推荐策略之后,
还包括:
根据所述数据分布推荐策略,对所述分布式数据库执行数据重分布。
8.根据权利要求5、6或7所述的数据表亲和性分析装置,其特征在于,所述根据所述关
权 利 要 求 书
1/2 页
2
文档被以下合辑收录
评论