暂无图片
暂无图片
暂无图片
暂无图片
暂无图片
一种数据集列序列化的高效连接比对实现方法及装置_CN114372097A_达梦数据.pdf
93
18页
0次
2023-06-26
免费下载
(19)中华人民共和国国家知识产权局
(12)发明专利申请
(10)申请公布号
(43)申请公布日
(21)申请号 202111660530.5
(22)申请日 2021.12 .30
(71)申请人 北京达梦数据库技术有
地址 100000 北京市大兴区北京经济技术
开发区科谷一街8号5号楼9层901
(72)发明人  吴鑫 高东升 姚艳玲 
(74)专利代理机构 深圳市六加知识产权代理有
限公 44372
代理人
(51)Int.Cl.
G06F
16/2458
(2019 .01)
G06F
16/2455
(2019 .01)
(54)发明
种数据集接比
方法及装置
(57)摘要
种数列化
连接对实现方法及装置。其中方法包括根据数
据集A和数据集B变量挑出数据集A和数据集B
连接列对数据集A包含的各连接列合并
合并A 对数B
各连接列合并及各非连接列合并得到数
B 据集A B
对结果将数据集A和数据集B合并为数据集C
据来C的
进行排列组合获得数据集A与数据集B的连接结
将数据集多个合并使
原本需要多对的数据过一列对就能完
缩短了对的时间本方法不需要进行
对象减少了排序性能开销。
权利要求书2页 说明书9页 附图6页
CN 114372097 A
2022.04.19
CN 114372097 A
1 .一种数据集列序列化的高效连对实现方法其特征在于包括
根据数据集A和数据集B变量挑选出数据集A和数据集B连接列
对数据集A包含的各个接列进行合并及各个非连列进行合并得到新的据集
A据集B含的个连进行及各列进行合到新的据集
B
据集A B 对的A 和数据集B进行
并为数据集C
C列的据来C列不同据来源的序对
到数据集A与数据集B连接结果。
2.据权利要求1所述的据集序列化的连接比实现方法其特在于
数据集A和数据集B的连接列为数据集A与数据集B具变量的所述数据集A
数据集B同的变量可以为一个或多个。
3 .据权利要求1所述的据集序列化的连接比实现方法其特在于所述
据集A合并据集A 及数B合并据集B仅为格的合并
后保留原有对象的排列方式合并据集A 和数据集B 只包含一列连接列和一
非连接列。
4 .据权利要求1所述的据集列化的高连接比对实现方法其特在于所述
据集A 据集B 还包括比对数据集A 和数据集B 序列化后的key值
具体为
分别对数据集A数据集B进行序列化将连接列转换为key值数组
对数据集A和数据集B序列化key值数组得出对结果。
5 .据权利要求4所述的据集序列化的高连接比对实现方法其特在于
分别对所述数据集A数据集B的进行序列化具体包括
对数据集A的连接列进行序列化将数据集A连接列转换为key值数组
对数据集B的连接列进行序列化将数据集B连接列转换为key值数组。
6 .据权利要求5所述的据集序列化的高连接比对实现方法其特在于
根据对的结果将数据集A和数据集B进行合并为数据集C具体合并规则为
A 和数B 列化后的相同的keykey
值合一起相同key应非列的对象合并一起非连合并仅仅
将单元格进行合并保留原有key值
保留key值不同的行数据。
7 .据权利要求1所述的据集序列化的连接比实现方法其特在于所述
获取数据集C非连接列不同数据来源的有序对的具体步骤包括
挑出数据集C非连接列内同时含有数据集A和数据集B数据的的对象
据数据数据集C的列来出的对象ListA和ListBListA
示来源于数据集A中ListB表示来源于数据集B中
拆分后的ListA和ListB列组据集C列不同源的
将有序对和数据集C其余非连接列对象排成一列组成非连接列。
权 利 要 求 书
1/2
2
CN 114372097 A
2
of 18
免费下载
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文档的来源(墨天轮),文档链接,文档作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论

关注
最新上传
暂无内容,敬请期待...
下载排行榜
Top250 周榜 月榜