暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

社区专访|开源之夏“最佳质量奖”项目诞生记

TuGraph 2025-02-13
356

 点击蓝字,关注我们


“开源之夏”是由中国科学院软件研究所“开源软件供应链点亮计划”发起并长期支持的一项暑期开源活动,旨在鼓励在校学生积极参与开源软件的开发维护,培养和发掘更多优秀的开发者,促进优秀开源软件社区的蓬勃发展,助力开源软件供应链建设。活动联合各大开源社区,针对重要开源软件的开发与维护提供项目开发任务,并向全球高校学生开放报名。

在2024年的开源之夏中,来自北京大学的庞红玉同学参与了 TuGraph 社区的项目贡献,并荣获开源之夏“最佳质量奖”。


目前,庞同学关注的开源技术领域包括大语言模型及其下游应用。


以下是 TuGraph 社区与庞同学的对话访谈:

1、与项目结缘


TuGraph:参与过哪些开源社区开发工作?是如何了解到“开源之夏”以及 TuGraph 开源项目的?


庞同学:本次算是第一次正式参与开源贡献。很早之前在小红书上看到大家安利“开源之夏”,发现这个活动很适合暑期有空闲时间且可以远程完成工作的同学,所以一直有关注。我是在 B 站上观看到 TuGraph 的开源之夏宣讲视频,并决定参与的。


当时社区的指导老师很详细地展示了我们 TuGraph 社区的几个项目的背景和内容。我对 Awesome-Text2GQL 这个项目很感兴趣,刚好暑期有一段空闲时间,同时这个项目的难度适中,跟我的知识背景和未来的发展规划也非常契合,于是决定申请。


2、参与项目贡献


TuGraph:你这次主要负责的 Awesome-Text2GQL 项目,能简单介绍一下它的意义和作用吗?


庞同学:Text2GQL 可以降低图数据库的学习成本,也是未来 AGI 时代智能体和数据库系统交互的重要一环,针对 Text2GQL 任务训练数据少、数据标注成本高的难点,Awesome-Text2GQL 实现了一个 Text2GQL 语料生成框架,通过基于语法制导的语料生成策略,并借助大语言模型的标注和泛化能力,构建了一条端到端的 Text2GQL 训练语料自动化生成、Text2GQL 智能体训练到智能体与 TuGraph-DB 交互的全流程。


TuGraph:在贡献过程中,有遇到哪些挑战吗,是如何克服的?


庞同学:在项目的开发过程中,我们多次遇到最初设计的技术方案的实现难度及效果都和预期有很大差距的问题。比如我们最初设计了一版基于模板的自然语言问题生成方案,但是我们发现这种生成方案获得的自然语言问题不够流畅和多样,而且设计这些模板非常耗时,需要大量的人工先验知识。


在这种情况下,我们针对任务和实现效果进行分析和拆解,将大语言模型的生成和泛化能力引入到语料生成的各环节,最终完成自然语言问题生成的任务。


TuGraph:对于获得开源之夏“最佳质量奖”,你认为最重要的因素是什么?有哪些经验可以分享给其他想参与开源项目的同学?


庞同学:首先非常感谢开源之夏和 TuGraph 社区对我的工作的肯定。


我觉得 Owner 精神和充足的动力是推动我在这个项目中从“做”到“做好”的关键。我的 MBTI 是 ESTJ,是一个非常务实和勇于承担的性格,我在项目进行的过程中,一直希望自己做的东西是一个有用、有借鉴价值的东西,因此比较注重项目完整性、代码的规范性,也撰写了详细的项目技术文档,希望可以降低大家的上手门槛。此外,我的两位指导老师戚仕鹏和吕松霖老师,在这个项目的推进过程中经常给予我非常积极的反馈,极大地鼓舞了我。另外,项目内容本身非常契合我未来的发展规划,这也是推动我持续发现问题、解决问题、提高质量的重要动力来源之一。


我觉得项目选择是双向的,大家可以在项目开始前充分评估自己的发展规划、兴趣等与项目的契合程度,选择适合自己的项目,这是把事情做好的关键。


3、个人感受与成长


TuGraph:在整个贡献过程中,你学到了哪些新技能或知识?


庞同学:技能方面,我觉得自己的编程能力提升很大,此外还有基于 Docker 的 C++ 和 Python 混合编程和调试的技能。


学习到编译原理、大语言模型及其微调的知识。


还通过 TuGraph 社区涉猎到 RAG 等方面的知识,了解到 DB-GPT 等实用的工程框架。


TuGraph:这次开源经历对你的技术成长或职业发展有何帮助?


庞同学:这次开源经历扩展了知识面、开阔了视野,让我认识到大语言模型的强大能力和 Text2GQL 的广泛应用空间,有助于在未来更容易做出更好的就业决策。


这一经历也丰富了我的项目经历,蚂蚁集团开源项目的背书,让我在求职过程中获得了很高的认可度,对我未来的职业发展帮助非常大,和 TuGraph 社区建立的良好链接,也给我带来了很多潜在的工作机会。


TuGraph:你对“开源精神”有怎样的理解?


庞同学:开源项目为大家提供了一个很好的实践和学习的平台,各种背景的人都可以在这里进行思想交流和创意碰撞,不仅新手可以快速成长,资深开发者也可以从中学习新技能。我觉得这种自由、创新的学习氛围是“开源精神”的魅力所在。


TuGraph:对更多计划参与开源的同学们有什么建议?


庞同学:参与开源项目是一个非常好的夯实编程基础、积累项目经验、开阔前沿视野的学习机会,开源项目的认可度和含金量也很高,非常推荐大家参与进来。


在选择社区和项目时,除了考虑自己的兴趣、专业知识和技能,还应当仔细查看社区发布的项目详情,越详细的项目内容越可能意味着你能获得的交流和指导更多,此外,比较好的社区平台背景和完善的文档也是支撑项目完成的关键。TuGraph 就是这样一个非常友好、非常适合大家参与的开源社区。


参与开源项目后,在心态上,一是具备自信,相信自己能够做好,能够以主人翁的姿态充分地参与项目。二是有持续学习的心态,开源项目往往面临各种挑战,需要不断学习和解决问题。当然还要有钻研精神。


4、对社区的印象与建议


TuGraph:在参与过程中,对 TuGraph 社区的印象和期望?


庞同学:硬核前沿,文档完善。TuGraph 是性能世界第一的图数据库,TuGraph 社区也一直走在 Graph+AI 探索的最前沿,社区公众号经常分享GraphRAG、DB+AI 等硬核知识。另外,TuGraph 社区的文档非常完善,极大地降低了入门学习图数据库的成本,对初学者非常友好。


在参与项目的过程中,社区指导老师也在积极参与调研实现方案,社区还提供了服务器、算力 API 等开发资源,全程和社区指导老师的沟通交流也非常通畅,让我感受非常好! 


得益于 TuGraph 开源社区的发展,今年非常有幸深度参与到 Awesome-Text2GQL 项目,感受到大模型时代 AI+DB 广阔的应用前景和成长空间。希望新的一年,TuGraph 能继续探索更多开源共建形式,开放更多、更有趣的开源课题,携手更多的开源开发者,早日实现真正“与图对话”的美好愿景!




·END·



欢迎关注TuGraph代码仓库✨

TuGraph-DB 图数据库

https://github.com/tugraph-family/tugraph-db

TuGraph-Analytics 流式图计算引擎

https://github.com/tugraph-family/tugraph-analytics

TuGraph-AGL 图学习引擎
https://github.com/tugraph-family/tugraph-antgraphlearning




文章转载自TuGraph,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论