暂无图片
暂无图片
6
暂无图片
暂无图片
暂无图片

2025 开源之夏|这个暑假,写下属于你的数据库代码!欢迎申报 Apache Cloudberry 项目

HashData 2025-05-22
385
🎉 开源之夏 2025 正在如火如荼进行中!Apache Cloudberry™(Incubating) 社区很荣幸入选本年度「开源之夏」活动的参与社区。2025 年度,Apache Cloudberry 社区共有两个技术挑战项目,涉及数据库安全、数据合规共享等方向课题,欢迎高校在校学生积极报名参与!

关于「开源之夏」

开源之夏(OSPP)是中国科学院软件研究所发起的“开源软件供应链点亮计划”系列暑期活动,旨在鼓励高校学生积极参与开源软件的开发维护,促进优秀开源软件社区的蓬勃发展。活动联合各大开源社区,针对重要开源软件的开发与维护提供项目开发任务,并向全球高校学生开放报名。

Apache Cloudberry 由 Greenplum Database 的原始开发者创建,是一款领先且成熟的开源大规模并行处理(Massively Parallel Processing,MPP)数据库。它基于 Pivotal Greenplum Database® 的开源版本,并采用了更现代的 PostgreSQL 内核,提供更高级的企业级功能。Apache Cloudberry 可用于数据仓库、复杂数据分析及 AI/ML 负载。

2024 年 11 月 5 日,Apache Cloudberry 正式加入 Apache 孵化器,并改名为 Apache Cloudberry™ (Incubating) 正式开启孵化,推动全球开发者共同参与内核开发与生态建设。

GitHub 地址:https://github.com/apache/cloudberry
项目官网:https://cloudberry.apache.org/

项目介绍

pgcrypto 扩展支持 SM2/SM3/SM4 等国密算法

项目简述

Cloudberry 作为一个基于 PostgreSQL 的分布式数据库系统,其安全性对于用户至关重要。目前,Cloudberry 通过 pgcrypto 扩展提供加密功能,但尚未支持国密算法标准支持,如 SM2、SM3 和 SM4。

本任务旨在扩展 Cloudberry 的 pgcrypto 模块,增加对国密算法的支持,使 Cloudberry 能够满足用户对数据安全和合规性的要求。具体来说,需要实现以下国密算法:
  • SM2:非对称加密算法,基于椭圆曲线密码学
  • SM3:密码散列算法
  • SM4:分组密码算法

实现这些算法后,用户将能够在 SQL 查询中使用国密算法进行数据加密、解密和签名验证操作,提高数据安全性并满足合规要求,该任务将为 Cloudberry 用户提供更多的加密算法选择。

项目难度进阶

项目导师Fanshen Kong kongfanshendata@gmail.com

Cloudberry Clean Room 原型系统设计与实现

项目简述

本项目旨在基于 Apache Cloudberry 的安全机制,设计并实现一个数据 Clean Room 原型系统,借鉴 Snowflake 和 AWS Clean Room 的理念,探索在多方数据协作中保护用户隐私、确保数据合规使用的技术实现路径。

该原型系统将支持以下核心能力:
  • 提供者和使用者模型:数据提供方可通过 Cloudberry Clean Room 安全共享结构化数据,数据使用方可在限制权限下完成数据联合分析。
  • 聚合分析限定:只允许返回脱敏或聚合后的分析结果,防止泄露原始记录。
  • 行列级权限控制:基于 Cloudberry 的权限系统,对用户可见数据进行精准控制。
  • 差分隐私实验:探索在 COUNT、SUM 等聚合函数中注入噪声,实现基础差分隐私保护。
  • 支持多方协作场景:如广告投放效果分析、并购数据尽职调查、医药合作研究等。
该项目最终将输出一套以 Cloudberry 为底座的原型实现、用例和基础文档,为未来在 Cloudberry 中正式支持数据 Clean Room 提供基础探索。
项目难度进阶
项目导师Alwin Tang xtang.code@gmail.com

学生参与指南

报名要求

  • 活动面向年满 18 周岁的高校在校学生。

  • 暑期即将毕业的学生,只要申请时学生证处在有效期内,就可以报名活动。
  • 国内高校学生报名需提供身份证、教育部学籍在线验证报告(学信网)或学生证等在读证明材料。国外高校学生或外籍学生需提供显示学生姓名与预计毕业时间的录取通知书、学生卡或其他在读证明材料。

中选学生可以获得什么

  • 结识开源界小伙伴和技术大牛
  • 获得社区导师的专业指导,与开源项目开发者深度交流
  • 丰富项目实践经验,提升项目开发技能
  • 为学习方向提供参考,为职业发展积累人脉
  • 通过结项考核的学生将获得组织方提供的结项奖金和结项证书
  • Apache Cloudberry 中文用户组周边纪念品

流程节点

  • 学生报名时间:2025年4月30日 - 6月9日

  • 项目申请书提交时间:5月9日 - 6月9日
  • 导师审核阶段:6月10日 - 6月24日
  • 项目开发周期:7月1日 - 9月30日
  • 结项审核与公示:11月9日
  • 年度优秀学生评选:11月

⚠️ 注意:每位学生仅可申请一个项目,申请书质量是评选关键,建议尽早提交!

活动小贴士

  • 申请人数较多,建议在正式提交项目申请前,确保与社区项目导师取得沟通,沟通意向和项目等情况。与导师沟通时,请遵守基本沟通礼仪。
  • 避免在最后一天提交项目意向,避免因不熟悉申请流程、缺少申请材料、网络等问题造成无法在截止时间内完成申请。
  • 认真阅读活动组织方整理的 学生参与指南。([2])。

更多信息

欢迎添加 Apache Cloudberry 社区小助手,保持沟通与联络,咨询项目问题:

引用链接

[1] 导师邮箱:Fanshen Kong kongfanshendata@gmail.com;Alwin Tang xtang.code@gmail.com
[2] 学生参与指南:https://blog.summer-ospp.ac.cn/help/student%20guide

文章转载自HashData,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论