暂无图片
暂无图片
暂无图片
暂无图片
暂无图片
数据库系统新型技术专题前言 - 李国良,于戈,杨俊,范举.pdf
619
3页
5次
2022-03-24
免费下载
软件学报 ISSN 1000-9825, CODEN RUXUEW E-mail: jos@iscas.ac.cn
Journal of Software, 2022,33(3):771773 [doi: 10.13328/j.cnki.jos.006459] http://www.jos.org.cn
©中国科学院软件研究所版权所有. Tel: +86-10-62562563
数据库系统新型技术专题前言
李国良
1
,
2
,
3
,
4
1
(清华大学 计算机科学与技术系, 北京 100084)
2
(东北大学 计算机科学与工程学院, 沈阳 辽宁 110167)
3
(Department of Computer Science, Duke University, Durham, USA)
4
(数据工程与知识工程教育部重点实验室(中国人民大学), 北京 100872)
通信作者: 李国良, E-mail: liguoliang@tsinghua.edu.cn
中文引用格式: 李国良, 于戈, 杨俊, 范举. 数据库系统新型技术专题前. 软件学报, 2022, 33 (3): 771–773. http://www.jos.
org.cn/1000-9825/6459.htm
近年来, 数据库系统为了应对新应用和新数据类型对数据管理与分析提出的全新挑战, 产生了一系列新
的发展趋势, 包括: (1) 在数据管理方面, 计算机硬件的创新与人工智能技术的深入为数据库系统带来了全新
的发展机会, 而伸缩性、容错性、可扩展性等应用需求又给数据管理带来了全新的挑战; (2) 在数据分析方面,
数据量的剧增、数据类型的异构与应用需求的多样对数据库系统的分析能力与性能提出了更高的要求; (3)
数据安全方面, 多方安全计算、联邦学习等应用和需求的变化给数据库安全与隐私保护技术带来了全新的课
. 因此, 需要利用和发展现有的数据库理论, 构建形成新的技术和系统经验. 本专题立足于数据库系统核心
技术, 探讨在大数据环境下数据库与数据管理技术的新发展与新趋势, 特别是聚焦如何利用数据管理技术的
深厚理论积淀和丰富技术成果, 促进数据库新型技术的发展, 解决遇到的各类与管理、分析、安全相关的痛
点、难点问题. 本专题重点关注具有创新性和突破性的高水平研究成果, 探讨相关基础理论、关键技术, 以及
在系统研发过程中关于系统设计原理、范式、架构、经验等方面的实质性进展, 探讨其在相关产业和领域的
应用前景.
本专题公开征文, 共收到投稿 26 . 论文均通过了形式审查, 内容涉及新型的数据管理、数据分析与数
据安全技术. 特约编辑先后邀请了 30 多位专家参与审稿工作, 每篇投稿至少邀请 2 位专家进行评审. 稿件经
初审、复审、在线论文宣读与专家评审 (因受新冠疫情影响, NDBC 2021 会议延期. 为不影响发表进度, 原定
于在 NDBC 上的会议宣读改为在线论文宣读) 和终审共 4 个阶段, 最终有 18 篇论文入选本专题. 根据主题,
这些论文可以分为 3 .
(1) 新型数据管理技术
Geno: 基于代价的异构融合查询优化器》提出了一种面向 CPU/GP U/ FP GA 异构计算融合的基于代价的
查询优化器, 设计了异构计算环境下查询处理的代价模型, 并基于代价评估解决了算子分配和调度等问题,
进而验证了所提优化方法可以充分发挥各异构资源的优势, 提升查询处理的性能.
《基于树型门控循环单元的基数和代价估计器》提出了一种基于树型门控循环单元的数据库基数和代价
估计技术, 设计了有效的特征提取和编码技术与面向字符串类型的谓词嵌入方, 进而验证了所提模型在估
计精度、预测时间等方面均优于现有基数估计算法.
AlphaQO: 鲁棒的学习型查询优化器》提出了一种基于强化学习学习型查询优化器训练框架, 目标是生
成学习型优化器难以优化的查询对其加以训练, 以提升学习型优化器的鲁棒性. 提出了基于图结构的查询生
成模型、少样本生成方法等策略, 并验证其可以提升学习型优化器的鲁棒性.
《面向非易失内存的异构索引》研究了树形索引在非易失内存 (NVM) 上的访问、持久化、范围查询等
收稿时间: 2021-1 0-08
772
软件学报 2022 年第 33 卷第 3
操作的性能优化问题, 提出了一种上下两层结构的新型异构索引结构. 该索引同时利用了 Radix 结点搜索速
度快以及 B+树范围查询性能好的优点, 取得了较好的综合性能.
《基于 NVM HTM 的低时延事务处理》提出了一种利用非易失性内存(NVM)降低硬件事务性内存
(HTM) 的内存事务处理时延的方法, 设计了 parity version 机制, 使得事务可以同时利用 HTM NVM 的特性
进行加速, 在实现上针对硬件的特性进行了一系列优化. 所提方法能够大幅度降低现有基于 HTM 的多核内存
数据库的事务提交时延, 提升事务吞吐.
《内存数据库并发控制算法的实验研究》从实验研究的角度系统地比较了现有的内存数据库并发控制算
, 提出了先定序后检验的思路, 对并发控制算法进行分类总结, 并基于在开源内存型分布式事务测试床
3TS 上的对比实验探究了各类算法的优缺点和适用场景, 为面向内存数据库的并发控制算法的研究提供了
参考.
NUMA 感知的持久内存存储引擎优化设计》提出了一种 NUMA 感知的非易失存储引擎优化设计方法,
设计了混合内存架构下跨 NUMA 节点的数据空间分布和分布式存取策略, 提出了 I/O 代理例程访问、Cache
Line Area 缓存页、事务处理等机制, 进而验证了该方法能够有效地提升 NUMA 架构下非易失存储引擎性能.
《数据库管理系统中数据异常体系化定义与分类》从数据管理的视角对数据异常进行了体系化的定义与
分类, 基于分类提出了针对不同粒度的隔离级别体系. 该体系有助于揭示基于数据异常定义隔离级别的规律.
另外还发现了 22 种未被其他文献报告过的新的数据异常.
(2) 新型数据分析技术
《基于大数据的分布式社会治理智能系统》构建了一个面向多方海量数据的安全查询、协同管理、智能
分析的社会治理智能系统. 该系统基于安全多方计算、区块链技术与精准智能理论, 解决了分布式社会治理
面临着的安全计算效率低、多方可信协同差、复杂任务决策难等挑战, 具备支撑社会治理各类应用的能力.
《基于键值存储的分布式时序相似性搜索方法》提出了一种面向键值存储的分布式时序相似性搜索方法,
设计了时序数据分块以解决时序数据维度高且不断增长的问题, 提出了极值剪枝和分块剪枝策略, 加快了相
似性查询的效率, 并验证了该方法在效率和扩展性方面均显著优于现有方法.
《时间序列对称模式挖掘》研究了时间序列数据的对称模式挖掘问题以支持轨迹跟踪、异常检测等应用,
提出了静态时间序列对称模式挖掘方法与数据流上的对称模式挖掘方法, 在真实工业时间序列数据集上进行
了实验评测, 验证了所提方法在挖掘效果和时间开销方面能够取得最佳性能.
《面向 Flink 迭代作业的动态资源分配策略》面向具有运行时限的 Apache Flink 迭代作业, 提出了一种基
于运行时间预测的动态资源分配策略, 设计了面向迭代超步的轻量级运行时间预测模型与基于运行时间预测
的动态资源分配策略, 并验证了预测模型和动态资源分配策略的有效性和性能提升效果.
《新型分布式计算系统中的异构任务调度框架》分析了面向机器学习的分布式大数据计算引擎在任务调
度上的局限性, 提出了一种异构任务调度框架, 设计了概率随机的调度策略、确定的平滑加权轮询算法、基
于容器的纵向扩容机制等策略, 并验证了所提框架可以实现 10%20%的性能提升.
RGraph: 基于 RDMA 的高效分布式图数据处理系统》研发了一个基于 RDMA 的高效分布式大图数据
处理系统, 提出了基于块的顶点划分方式, 设计了保证负载均衡的任务迁移机制和线程间细粒度任务抢夺方
, 实现了高效的 RDMA 通信模型, 并验证了所提系统在典型图计算问题上具有明显的性能优势.
《面向大规模二部图的分布式 Tip 分解算法》提出了一种面向大规模二部图的分布式 Tip 分解技术, 设计
了基于中继的通信模式以解决消息的有效传递、一系列分布式算法和剪枝策略, 能够有效地减少冗余通信和
计算开销, 进一步提高算法效率. 多个真实数据机上的实验结果验证了所提方法的有效性和高效性.
(3) 新型数据安全技术
《联邦学习中的隐私保护技术》分析了联邦学习过程中面临的隐私风险, 总结出重建、推断两种攻击策
, 依据联邦学习隐私保护机制的视角综述了隐私保护技术, 从本地、中心与本地结合这 3 个层面总结现有
的隐私保护策略与算法, 最后探讨了联邦学习隐私保护面临的挑战并展望未来的发展方向.
of 3
免费下载
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文档的来源(墨天轮),文档链接,文档作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论

关注
最新上传
暂无内容,敬请期待...
下载排行榜
Top250 周榜 月榜