暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

开源之夏召集令!TuGraph 社区课题等你来解锁

TuGraph 2025-04-29
282
点击蓝字,关注我们


伴随开源之夏启动,TuGraph 社区在开源之夏精心准备了4个项目,邀请同学们一起探索图数据库的无限潜力!无论你是图数据库的应用派,还是 Graph+AI 的探索者,都能找到适合你的课题,快来用代码与 TuGraph 图数据库一起创造这个夏天的独特回忆吧!

开源之夏

“开源之(英文简称 OSPP)”是中国科学院软件研究所“开源软件供应链点亮计划”指导下的系列暑期活动,旨在鼓励在校学生积极参与开源软件的开发维护,培养和发掘更多优秀的开发者,促进优秀开源软件社区的蓬勃发展,助力开源软件供应链建设。

活动联合各大开源社区,针对重要开源软件的开发与维护提供项目任务,并向全球高校学生开放报名。学生可自主选择感兴趣的项目进行申请,中选后在项目资深开发者(社区导师)的指导下进行开发。同学们能够借此机会积累实践经验,提高技术能力,结识开源前辈,成功入选并完成结项的同学,还将获得项目奖金荣誉证书

 往届 TuGraph 项目参与者代表

庞同学开源之夏“最佳质量奖”获得者)

2024年的开源之夏中,来自中国科学技术大学的庞红玉同学参与了 TuGraph 社区的项目贡献,并荣获开源之夏“最佳质量奖”。


May(从TuGraph社区到硅谷Offer)

来自南开大学的 May 同学参与了2024年「开源之夏」的 TuGraph 图数据库项目课题。在该项目中,她针对行式计算在处理大量多列数据时的性能问题,在导师指导下引入列式计算,并通过 SIMD 指令集实现向量化加速,显著提升了 TuGraph 的性能。

就在上个月社区也收到了 May 同学的喜讯:她成功斩获了硅谷大厂 Snowflake 的 Offer。在面试中,她的社区项目经历成为了她脱颖而出的关键因素。


2025 TuGraph 项目介绍

今年,TuGraph 为同学们准备了 4 个项目。成功结项的同学将获得 ¥8,000—12,000 的奖金与荣誉证书

项目1:基于MiniGU的向量存储与索引支持

项目简介:

背景:随着大模型时代的到来和RAG应用的普及,向量数据(vector)作为非结构化数据的重要表示形式,在图数据库中的存储与检索需求日益增长。图数据库亦需要实现高效的向量存储方案和专用索引,以支持图结构数据与向量特征的联合查询。MiniGU当前尚未原生支持向量数据类型,缺乏图结构数据的关联分析能力。
预期目标:
  • 为MiniGU(Rust图数据库)设计向量数据存储结构,完成向量存储模块的Rust实现。
  • 集成高效的向量索引算法库,支持至少一种索引算法。
  • 提供向量相似度搜索的查询接口(兼容现有图查询语言的扩展),支持图遍历与向量相似度搜索的联合查询。
  • 构建结合图遍历与向量检索的混合查询Demo。
技术领域:Graph Database、Vector Database
编程语言Python、Rust

项目难度:基础奖金8000元) 

项目导师:戚仕鹏(楚祺)

联系邮箱:qishipeng.qsp@antgroup.com

项目备注:本课题需要学生具备系统编程的能力,适合对数据库内核开发有浓厚兴趣的同学。

项目2:面向复杂Text2GQL任务的数据模拟和模型训练
项目简介:
背景:近年来,在关系型数据库的Text2SQL领域,随着大型语言模型 (LLM) 经历了快速的迭代和进化,传统的Spider、BIRD等由较为简单的语料对构成的Text2SQL数据集已经无法对大模型的翻译能力构成挑战,最新的如Spider2.0,BIRD-CRITIC等数据集已经开始对大模型在更复杂、更接近生产的环境中的翻译能力,及完整的workflow执行能力提出了挑战。与Text2SQL对应的图数据库Text2GQL 领域在学术界的研究则才刚刚起步,相关的语料十分匮乏,Awesome-Text2GQL框架借助语法解析与大模型的能力实现了Text2GQL语料的快速泛化,弥补了Text2GQL领域语料不足的缺陷,但生成的语料依然与复杂的生产环境有一定的距离。因此,如何借助大模型的能力生成复杂的Text2GQL任务并提高大模型在不同数据集上的迁移能力和在更复杂的Text2GQL任务中的翻译能力成为了重要的研究课题。
预期目标:
    • 实现基于schema的模拟数据生成功能。

    • 实现基于大模型的复杂Text2GQL任务和对应Query的生成功能(包含调用内置算法,复杂query翻译,模糊问题翻译,复杂问题拆解等场景)。

    • 基于大模型及RAG等技术,构建能够执行复杂Text2GQL任务的智能体。

    技术领域:Graph Database、AI
    编程语言Python

    项目难度:基础奖金8000元) 

    项目导师:吕松霖

    联系邮箱:lyusonglin.lsl@antgroup.com

    项目备注:本课题需要学生具备优秀的科研和编程基础,适合对AI应用开发和Text2GQL/Text2SQL有浓厚兴趣的同学。

    项目3:基于分布式图计算的自适应Path结构优化
    项目简介:
    背景:在分布式图计算领域,随着图数据规模的快速增长和复杂查询需求的增加(如路径搜索、子图匹配等),如何高效地处理大规模图上的路径匹配问题成为关键挑战。传统的静态Path结构在面对动态图或异构图时往往表现出性能瓶颈,尤其是在分布式环境下,节点间的通信开销和负载不均衡问题进一步加剧了计算成本。因此,设计一种能够根据图特征和查询模式动态调整的自适应Path结构,对于提升分布式图计算系统的性能至关重要。
    本课题旨在探索并实现一种针对分布式图计算优化的自适应Path结构,通过结合图分割策略、查询模式分析以及动态路径剪枝技术,显著降低路径匹配过程中的计算与通信开销,同时支持高效的分布式执行。
    预期目标:
    1、提出一种能够根据图拓扑特征和查询模式动态调整的Path结构设计方案,能够结合分布式环境下的图分割算法,优化路径存储与访问效率。
    2、实现分布式Path优化模块,能够插件式应用的GQL, 图算法中(应用于SSSP,ALLPath等算法、应用于多跳及不定跳GQL场景)。
    3.  构建一个结合实际应用场景的分布式路径匹配演示系统,展示自适应Path结构在性能上的提升效果。
    扩展方向:
    • 动态图支持:研究如何将自适应Path结构扩展至动态图场景,支持实时更新和增量计算。
    • 异构计算优化:结合GPU加速技术,进一步提升路径匹配的计算效率。
    • 跨平台兼容性:将自适应Path结构移植到其他分布式图计算框架,验证其通用性。
    总结:本题聚焦于分布式图计算领域中的路径匹配优化问题,通过设计和实现自适应Path结构,解决传统静态路径结构在性能和扩展性上的不足。项目不仅具有理论研究价值,还能够为实际应用提供高效的解决方案,是分布式图计算领域的前沿研究方向之一。
    技术领域:Graph Database、GraphQL
    编程语言Java、Python

    项目难度:进阶奖金12000元) 

    项目导师:姚中强

    联系邮箱:zhongqiang.yzq@antgroup.com

    项目备注:

    1、本课题需要学生具备分布式系统开发能力,适合对图计算和分布式系统有浓厚兴趣的同学。

    2、项目涉及分布式图计算的核心技术,包括图分割、负载均衡、通信优化等,具有较高的技术挑战性。

    项目4:Graph智能体工作流的自动生成与优化
    项目简介:

    背景:传统的智能体工作流设计,需要大量的人工编排和手动优化工作,不利于智能体能力的快速扩展。随着大模型技术的发展以及推理模型能力的提升,工作流自动生成与优化技术不仅可以降低智能体系统的构建成本,还能降低人工构建的工程约束对智能体推理带来的限制以及负面影响。Chat2Graph作为图数据库上的智能体系统,旨在解决高效用图的问题,当下亟需通过自动工作流技术加速和改进Graph智能体构建,实现图领域上准确的任务拆解、高效的推理执行以及合理的工具调用。

    预期目标:

    • 结合图数据库领域知识,搭建图领域合成数据解决方案,构建工作流训练和测试数据集。

    • 设计和研发先进的工作流离线训练算法,加速和优化Graph智能体构建。

    • 落地工作流自动生成和优化模块,提供人工编排相当的性能和推理质量,开发相关API。

    • 提供项目设计文档和演示Demo。

    技术领域:Graph Database、AI
    编程语言Python

    项目难度:进阶奖金12000元) 

    项目导师:范志东

    联系邮箱:zhidong.fzd@antgroup.com

    项目备注:本课题需要学生兼具优秀的科研和工程基础,适合对智能体自动工作流优化,以及构建自治智能体系统有浓厚兴趣的同学。

    TuGraph 社区项目导师宣讲视频:
    TuGraph 社区主页及项目详情:https://summer-ospp.ac.cn/org/orgdetail/7286a2dd-7b46-4795-a011-817af3e3cde6?lang=zh

    项目申报

    4月4日-6月9日,符合条件的学生可以通过开源之夏官网(https://summer-ospp.ac.cn/)注册、与导师沟通项目并提交项目申请。

    TuGraph社区项目感兴趣的同学,欢迎通过邮箱直接沟通导师。期待优秀的你加入TuGraph社区项目,在这个暑假深入领略开源技术的魅力,积累一段业务实战经历。


    ·END·



    欢迎关注TuGraph代码仓库✨

    TuGraph-DB 图数据库

    https://github.com/tugraph-family/tugraph-db

    TuGraph-Analytics 流式图计算引擎

    https://github.com/tugraph-family/tugraph-analytics

    TuGraph-AGL 图学习引擎
    https://github.com/tugraph-family/tugraph-antgraphlearning




    文章转载自TuGraph,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

    评论