
772
软件学报 2022 年第 33 卷第 3 期
操作的性能优化问题, 提出了一种上下两层结构的新型异构索引结构. 该索引同时利用了 Radix 结点搜索速
度快以及 B+树范围查询性能好的优点, 取得了较好的综合性能.
《基于 NVM 和 HTM 的低时延事务处理》提出了一种利用非易失性内存(NVM)降低硬件事务性内存
(HTM) 的内存事务处理时延的方法, 设计了 parity version 机制, 使得事务可以同时利用 HTM 和 NVM 的特性
进行加速, 在实现上针对硬件的特性进行了一系列优化. 所提方法能够大幅度降低现有基于 HTM 的多核内存
数据库的事务提交时延, 提升事务吞吐.
《内存数据库并发控制算法的实验研究》从实验研究的角度系统地比较了现有的内存数据库并发控制算
法, 提出了“先定序后检验”的思路, 对并发控制算法进行分类总结, 并基于在开源内存型分布式事务测试床
3TS 上的对比实验探究了各类算法的优缺点和适用场景, 为面向内存数据库的并发控制算法的研究提供了
参考.
《NUMA 感知的持久内存存储引擎优化设计》提出了一种 NUMA 感知的非易失存储引擎优化设计方法,
设计了混合内存架构下跨 NUMA 节点的数据空间分布和分布式存取策略, 提出了 I/O 代理例程访问、Cache
Line Area 缓存页、事务处理等机制, 进而验证了该方法能够有效地提升 NUMA 架构下非易失存储引擎性能.
《数据库管理系统中数据异常体系化定义与分类》从数据管理的视角对数据异常进行了体系化的定义与
分类, 基于分类提出了针对不同粒度的隔离级别体系. 该体系有助于揭示基于数据异常定义隔离级别的规律.
另外还发现了 22 种未被其他文献报告过的新的数据异常.
(2) 新型数据分析技术
《基于大数据的分布式社会治理智能系统》构建了一个面向多方海量数据的安全查询、协同管理、智能
分析的社会治理智能系统. 该系统基于安全多方计算、区块链技术与精准智能理论, 解决了分布式社会治理
面临着的安全计算效率低、多方可信协同差、复杂任务决策难等挑战, 具备支撑社会治理各类应用的能力.
《基于键值存储的分布式时序相似性搜索方法》提出了一种面向键值存储的分布式时序相似性搜索方法,
设计了时序数据分块以解决时序数据维度高且不断增长的问题, 提出了极值剪枝和分块剪枝策略, 加快了相
似性查询的效率, 并验证了该方法在效率和扩展性方面均显著优于现有方法.
《时间序列对称模式挖掘》研究了时间序列数据的对称模式挖掘问题以支持轨迹跟踪、异常检测等应用,
提出了静态时间序列对称模式挖掘方法与数据流上的对称模式挖掘方法, 在真实工业时间序列数据集上进行
了实验评测, 验证了所提方法在挖掘效果和时间开销方面能够取得最佳性能.
《面向 Flink 迭代作业的动态资源分配策略》面向具有运行时限的 Apache Flink 迭代作业, 提出了一种基
于运行时间预测的动态资源分配策略, 设计了面向迭代超步的轻量级运行时间预测模型与基于运行时间预测
的动态资源分配策略, 并验证了预测模型和动态资源分配策略的有效性和性能提升效果.
《新型分布式计算系统中的异构任务调度框架》分析了面向机器学习的分布式大数据计算引擎在任务调
度上的局限性, 提出了一种异构任务调度框架, 设计了概率随机的调度策略、确定的平滑加权轮询算法、基
于容器的纵向扩容机制等策略, 并验证了所提框架可以实现 10%−20%的性能提升.
《RGraph: 基于 RDMA 的高效分布式图数据处理系统》研发了一个基于 RDMA 的高效分布式大图数据
处理系统, 提出了基于块的顶点划分方式, 设计了保证负载均衡的任务迁移机制和线程间细粒度任务抢夺方
式, 实现了高效的 RDMA 通信模型, 并验证了所提系统在典型图计算问题上具有明显的性能优势.
《面向大规模二部图的分布式 Tip 分解算法》提出了一种面向大规模二部图的分布式 Tip 分解技术, 设计
了基于中继的通信模式以解决消息的有效传递、一系列分布式算法和剪枝策略, 能够有效地减少冗余通信和
计算开销, 进一步提高算法效率. 多个真实数据机上的实验结果验证了所提方法的有效性和高效性.
(3) 新型数据安全技术
《联邦学习中的隐私保护技术》分析了联邦学习过程中面临的隐私风险, 总结出重建、推断两种攻击策
略, 依据联邦学习隐私保护机制的视角综述了隐私保护技术, 从本地、中心与本地结合这 3 个层面总结现有
的隐私保护策略与算法, 最后探讨了联邦学习隐私保护面临的挑战并展望未来的发展方向.
评论