暂无图片
暂无图片
暂无图片
暂无图片
暂无图片
实体增强规则的挖掘方法、装置、设备及介质_CN119047560A_深圳计算科学研究院.pdf
34
23页
0次
2024-12-09
免费下载
(19)国家知识产权局
(12)发明专利申请
(10)申请公布号
(43)申请公布日
(21)申请号 202410938865 .6
(22)申请日 2024 .07 .12
(71)申请人 深圳计算科学研究院
地址 518000 广东省深圳市龙华区民治街
道红山六九七九商业中心(二期)9
261001
(72)发明人 谢珉 张广怡 樊文飞 韩紫燕 
(74)专利代理机构 深圳众鼎专利商标代理事务
(普通合伙) 44325
专利代理师 谭果林
(51)Int.Cl .
G06N
5/025
(2023 .01)
(54)发明名称
实体增强规则的挖掘方法装置设备及介
(57)摘要
本申请适用于大数据挖掘技术领域尤其涉
及一种实体增强规则的挖掘方法装置设备及
介质该方法对候选谓词集合进行规则构建和规
则挖掘按照已知的目标通过迭代搜索和剪枝
操作找到挖掘出最佳的预设条数的规则通过
设置收益得分上下界和可信度对候选规则进行
筛选将有效的规则通过收益提升的方式进行判
定,并且将已经处理过且未来扩展无法达到最佳
的规则进行排除限定了下一轮迭代的规则
不必要干扰避免了多次迭代的规则冗余处
理,由于规则处理量的降低有效地提高了处理效
权利要求书3页 说明书14页 附图5页
CN 119047560 A
2024.11.29
CN 119047560 A
1 .一种实体增强规则的挖掘方法其特征在于所述挖掘方法包括
初始化初始挖掘规则集合和已使用谓词集合为空集将候选谓词集合中每一个候选谓
词分别与所述已使用谓词集合合并得到对应候选谓词的已使用谓词集合使用每个候选
谓词的已使用谓词集合中所有谓词结合已知规则的规则目标构建得到对应的候选规则
根据预设的相关性度量和预设的多样性度量对每个候选规则及其扩展得到的规则进
行收益评分得到每个候选规则对应收益得分上界和收益得分下界
计算每个候选规则的可信度根据每个候选规则的收益得分上界收益得分下界和可
信度确定候选最佳规则子集和下一轮迭代候选规则子集将候选最佳规则子集中每个规
则分别添加至所述初始挖掘规则集合得到每个规则对应的更新规则集合
计算每个更新规则集合相较于所述初始挖掘规则集合的收益提升量确定所述收益提
升量最高的更新规则集合对应的规则为本轮迭代的最佳规则将所述最佳规则添加至所述
初始挖掘规则集合得到更新的挖掘规则集合将所述候选最佳规则子集中除最佳规则以
外的规则添加至所述下一轮迭代候选规则子集得到更新的下一轮迭代候选规则子集
在下一轮迭代中以所述更新的下一轮迭代候选规则子集进行扩展搜索得到扩展规
则,将所述扩展规则作为所述候选规则并将所述更新的挖掘规则集合作为所述初始挖掘
规则集合返回执行计算每个候选规则的可信度直至所述更新的挖掘规则集合中规则条
数达到预设条数或者达到预设迭代次数,得到更新的挖掘规则集合
2.根据权利要求1所述的挖掘方法其特征在于所述根据每个候选规则的收益得分上
收益得分下界和可信度确定候选最佳规则子集和下一轮迭代候选规则子集包括
检测每个候选规则的可信度是否大于可信度阈值若检测到一候选规则的可信度不大
于所述可信度阈值则将所述候选规则归为下一轮迭代候选规则子集
若检测到一候选规则的可信度大于所述可信度阈值则将所述候选规则作为候选最佳
规则针对所有候选最佳规则中第一候选最佳规则和第二候选最佳规则若检测到所述第
一候选最佳规则对应的收益得分下界大于所述第二候选最佳规则对应收益得分上界则将
所述第二候选最佳规则归为所述下一轮迭代候选规则子集
若检测到所述第一候选最佳规则对应的收益得分上下界和所述第二候选最佳规则对
应的收益得分上下界之间存在交叉则将所述第一候选最佳规则和所述第二候选最佳规则
均归为候选最佳规则子集
3.根据权利要求1所述的挖掘方法其特征在于在所述计算每个候选规则的可信度之
后,还包括
获取所述初始挖掘规则集合的剩余名额所述剩余名额为所述预设条数与所述初始挖
掘规则集合中当前条数的差值
按照收益得分下界从高至低的方式对所有候选规则排序确定排序为所述剩余名额对
应数值的候选规则为下限规则
将所有候选规则中收益得分上界小于所述下限规则的收益得分下界的候选规则归为
排除规则子集所述排除规则子集中的所有规则被剔除出所有轮次迭代
4 .根据权利要求1所述的挖掘方法其特征在于所述计算每个更新规则集合相较于所
述初始挖掘规则集合的收益提升量包括
使用目标函数计算得到所述初始挖掘规则集合的第一收益得分以及每个更新规则
权 利 要 求 书
1/3
2
CN 119047560 A
2
of 23
免费下载
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文档的来源(墨天轮),文档链接,文档作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论

关注
最新上传
暂无内容,敬请期待...
下载排行榜
Top250 周榜 月榜