暂无图片
暂无图片
暂无图片
暂无图片
暂无图片
CN202210137615.3_基于连接简图的数据库连接基数估计方法和系统_GoldenDB.pdf
23
9页
2次
2023-06-15
免费下载
(19)国家知识产权局
(12)发明专利申请
(10)申请公布号
(43)申请公布日
(21)申请号 202210137615.3
(22)申请日 2022.02 .15
(71)申请人 北京大学
地址 100871 北京市海淀区颐和园路5号北
京大学
申请人 中兴通讯股份有限公
(72)发明人 杨仝 王飞宇 屠要峰 杨洪章 
(74)专利代理机构 北京知识产权代
11200
专利代理师 邱晓锋
(51)Int.Cl.
G06F
16/2453
(2019 .01)
G06F
16/25
(2019 .01)
(54)发明
简图库连
和系
(57)摘要
种基简图
系统法的
元素过滤器将数据库表中的元素分为热元
与冷将冷
素存储至冷元素Sketch中分别计算两个数据库
表的热元素表的连接基数冷元素Sketch的连接
基数及热元素表和冷元素Sketch的连接基数
相加得到对该两个数据库表的连接基数的
本发通过将热和冷
提高对数据库连接基数估计的精且算法的
时间和空间开销都有所下降精确的连接基数估
从而提升数据库复杂查询的性能。
权利要求书2页 说明书5页 附图1页
CN 114625760 A
2022.06.14
CN 114625760 A
1 .一种基于连接简图的数据库连接基数估计方法其特征在于包括下步
元素过滤器将数据库表中的元素分为热元素与冷元素
将热元素存储至热元素表中将冷元素存储至冷元素Sketch中
别计算两个据库表的热元素表的接基数元素Sketch的接基数以及热元素
表和冷元素Sketch连接基数相加到对该两个数据库表连接基数的估计结果。
2.利要1特征用来存
表项由元素和计数部分是元素的个哈计数录热
出现的频数。
3 .利要1方法桶包
括若干个记录每条记录由元素指纹和计数器两部分组成元素指纹是元素的一个哈希值
计数器记录元素出现频数。
4 .据权利要求1所述的其特征在于述冷元Sketch是CM Sketch干个
计数器组成并且有d个相互独立的哈希函数希函数的将一个元素随机映射到CM
Sketch一个计数器内。
5 .据权利要求1所述的其特在于将数库表的个元素插入到热元
冷元素Sketch中时该元素首先被插入到元素过滤器中元素过滤器计算该元素的哈希值
然后将其射到一个根据该桶中是否包含该元素有四种不同的处理情况
如果该桶包含这个元素那么将该元素的计数器加1
如果该桶不包含这个元素且有空记录则将该元素插入到空记录所在位置
如果该桶不含这个元素且桶是满的桶中频数最大的素的频数否超过阈
值T如果超过则认为这个最大的元素是热元素把热元素插入到热元素表中后将待插
元素插入到热元素原来的位置
如果该桶不含这个元素且桶是满的且桶中最大的素数量不于T则通过种选
择方式选择桶中的一个元素将该元素视为冷元插入到冷元素Sketch中然后将待插入
的元素插入到冷元素原来位置。
6 .利要5方法桶中个元
式为下中的一种随机选择依概率选择选择频数最小元素。
7 .据权利要求1所述的其特在于所述计算不同库表的热元和冷元
素Sketch的连接基数包括
据库1和数库表2的相同则认是同
一个元素对应的计数器相乘并对所乘积求
对于冷元素Sketch据库表1和数据库表2的冷元Sketch对应位置的计数器的值
相乘并求
对于数库表1的元素表中的每一个元素在数据库表2中的冷元Sketch中询频
数的于数表2的表中的每一元素在数据库表1中Sketch
中查询频数估计值。
8.用权17利要法的简图的库连
数估计系统其特征在于包括
元素过滤模块元素过滤器将数据库表中的元素分为热元素与冷元素
权 利 要 求 书
1/2
2
CN 114625760 A
2
of 9
免费下载
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文档的来源(墨天轮),文档链接,文档作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论

关注
最新上传
暂无内容,敬请期待...
下载排行榜
Top250 周榜 月榜