暂无图片
暂无图片
暂无图片
暂无图片
暂无图片
一种批流一体化数据处理系统及方法-CN116775699A-武智晖-刘辉-徐海勇-陶涛-尚晶-江勇-陈卓-郭志伟-中移动信息技术有限公司.pdf
502
21页
106次
2024-04-12
免费下载
(19)国家知识产权局
(12)发明专利申请
(10)申请公布号
(43)申请公布日
(21)申请号 202210237132 .0
(22)申请日 2022 .03 .11
(71)申请人 中移动信息技术有限公司
地址 100033 北京市西城区金融大街29号A
申请人 中国移动通信集团有限公司
(72)发明人 武智晖 刘辉 徐海勇 陶涛 
尚晶 江勇 陈卓 郭志伟 
(74)专利代理机构 北京路浩知识产权代理有限
公司 11002
专利代理师 陈新生
(51)Int.Cl.
G06F
16/2455
(2019 .01)
G06F
16/242
(2019 .01)
G06F
16/22
(2019 .01)
G06F
16/2458
(2019 .01)
G06F
3/06
(2006 .01)
(54)发明名称
一种批流一体化数据处理系统及方法
(57)摘要
本申请提供一种批流一体化数据处理系统
及方法涉及数据处理技术领域所述系统包括
内存抽象模块用于根据数据计算模式对序列化
后的内存数据进行内存管理序列化与反序列化
模块用于进行数据对象和内存数据的相互转
SQL代码生成模块用于根据数据计算模式将
待处理内存数据生成基于Pax存储结构的向量式
SQL执行代码算子模块用于采用基于Pax存储
结构的数据处理模式执行向量式SQL执行代码
以对待处理内存数据进行数据处理本申请能够
有效兼顾流计算和批处理两种计算模式保留了
流处理的低延迟性能并提供更高的批处理吞吐
能力同时优化了窗口计算的效率提高了特定
窗口统计场景的计算性能。
权利要求书2页 说明书14页 附图4页
CN 116775699 A
2023.09.19
CN 116775699 A
1 .一种批流一体化数据处理系统其特征在于包括
内存抽象模块用于在Flink内存分配最小单元的内部根据当前的数据计算模式对序
列化后的内存数据进行内存管理其中所述数据计算模式包括流计算模式和批处理模式
所述内存数据为采用Pax存储结构
序列化与反序列化模块用于进行数据对象和内存数据的相互转换
SQL代码生成模块用于根据当前的数据计算模式将待处理内存数据生成基于Pax存储
结构的向量式SQL执行代码
算子模块用于采用基于Pax存储结构的数据处理模式执行所述向量式SQL执行代码
以对所述待处理内存数据进行数据处理
2.根据权利要求1所述的批流一体化数据处理系统其特征在于所述算子模块包括多
个算子单元每一所述算子单元用于获取输入数据流基于所述向量式SQL执行代码从所
述数据流的数据页中取出数据记录在对多条数据记录循环批量处理之后写入到新的数
据页中继而输出以数据页为单位的数据流
3 .根据权利要求1所述的批流一体化数据处理系统其特征在于所述内存抽象模块
具体还用于根据当前的数据计算模式选取相应的数据页存储参数对所述内存数据进行
内存管理其中所述数据页存储参数包括数据记录条数最大等待时间和数据页默认最大
内存空间
4 .根据权利要求3所述的批流一体化数据处理系统其特征在于所述内存抽象模块
具体还用于
在流计算模式下根据当前数据积压情况对所述内存数据的数据记录条数进行实时自
适应调整在所述数据页默认最大内存空间的约束下基于所述最大等待时间和调整后的
数据记录条数对所述内存数据进行内存管理
在批处理模式下基于所述数据页默认最大内存空间对所述内存数据进行内存管理
5 .根据权利要求1所述的批流一体化数据处理系统其特征在于所述内存抽象模块包
括数据插入管理单元数据更新管理单元和数据删除管理单元其中
所述数据插入管理单元用于在数据插入时生成新数据页并根据数据属性值的长度
对所述新数据页进行子数据页分配继而将待插入数据记录的属性分别复制至不同子数据
页中
所述数据更新管理单元用于在数据更新时若根据待更新数据记录需要更新的属性
值在不同子数据页里面的偏移量判断超出子数据页可用空间则向该子数据页的相邻子数
据页申请空间若无法从相邻子数据页申请空间则重新申请新数据页并将待更新数据记
录移到新申请的数据页中同时将旧数据页中被更新的数据记录标记为删除
所述数据删除管理单元用于在数据删除时在数据页的预设位图中对待删除数据进
行标记当标记的待删除数据记录超过预设阈值时则对标记的待删除数据记录进行删除
并生成新的数据页进行数据存储
6 .根据权利要求1所述的批流一体化数据处理系统其特征在于所述序列化与反序列
化模块包括第一序列化与反序列化单元和第二序列化与反序列化单元其中
所述第一序列化与反序列化单元用于在流计算模式下将接收到的事件数据对象进
行序列化并按照Pax存储结构写入对应的子数据页中还用于从Pax存储结构中读取对应的
权 利 要 求 书
1/2
2
CN 116775699 A
2
of 21
免费下载
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文档的来源(墨天轮),文档链接,文档作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。
关注
最新上传
暂无内容,敬请期待...
下载排行榜
Top250 周榜 月榜