暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

开源人物|TuGraph 王延楠:保持好奇心以及make your hands dirty

TuGraph 2024-07-25
320

开源之夏是中国科学院软件研究所发起的“开源软件供应链点亮计划”系列暑期活动,旨在鼓励高校学生积极参与开源软件的开发维护,促进优秀开源软件社区的蓬勃发展。活动联合各大开源社区,针对重要开源软件的开发与维护提供项目开发任务,并向全球高校学生开放报名。


本期开源之夏2024专访来自TuGraph社区的王延楠导师,在开源之夏2024中指导的项目是:TuGraph-DB 查询链路向量化执行
项目链接:
https://summer-ospp.ac.cn/org/prodetail/247280535


#关于王延楠和TuGraph

ospp:请您介绍一下自己
王延楠:大家好,我是王延楠,目前在蚂蚁集团图计算团队担任图数据库技术专家一职;TuGraph即是我们团队的开源产品之一,我参与建设过TuGraph的部分能力,并始终对其发展保持关注。

ospp:您所在的社区 TuGraph 有哪些特色?它在图技术领域扮演着怎样的角色?

王延楠:TuGraph社区,源于蚂蚁图计算团队,以技术领跑为目标,在各大赛事中屡获佳绩。我们积极参与线上交流与技术探讨,倡导开源合作,为图数据库和图计算领域人士提供专业平台。


ospp:作为图技术领域技术专家,结合您的经历,您如何评估开源在图计算研发中的重要性?它带来了哪些具体的好处和潜在的挑战?

王延楠:开源项目不仅提升了透明度和信任度,还推动了文档资源的丰富和社区支持的强化,形成良性循环。但就我目前的观察而言,开源对于TuGraph的意义更为深远:它如同一座桥梁,将众多关注基础软件与图计算领域的同仁紧密相连;在这个平台上,我们共同探讨图计算的未来走向,我们展望一个以图计算为核心的数据存储与计算新时代的来临。

开源项目本身有一些共性的挑战,比如社区合作带来的代码质量问题需要我们TuGraph团队重视起来,鼓励社区成员参与把控,无论是提交问题、建议还是贡献代码。


ospp:您对图计算和图数据库的未来发展有何看法?对于想要进入这一领域的学生和开发者,您有哪些建议?
王延楠:我相信将图论用计算机科学表达是一项天才之举,但目前看来图计算/图数据库要成为新时代的数据底座仍任重道远,主要矛盾在于传统关系型数据库和传统大数据分析引擎仍占有不菲的市场比重;应该承认,借助AI发展图计算产品事半功倍,应聚焦服务AI场景,如近期热门的GraphRAG,在关键领域夯实图计算基础。
我对有志于进入这一行业的同仁们有两点小建议,其一是保持好奇心,弄明白图论和计算机结合的一些理论基础,并结合目前这些日新月异的AI技术,大胆想象图计算的可能发展;其二是老生常谈但又真的万分重要:make your hands dirty ,多操作多实践,往往会让思想更敏锐。

#参与开源之夏

ospp:请介绍一下您在开源之夏2024中指导的项目,您对这个项目的重要性和潜在影响有何评价?

王延楠:我申请并指导的项目题目是查询链路向量化执行,是基于"大规模图数据处理"这一目标提出来的具体方案之一。因为通过我们的观察,图数据库的使用场景往往以大量数据分析为主,而且从其客观的发展趋势看,未来对数据库软件的需求中数据分析的占比只会越来越高;为了匹配这个未来的发展趋势,提升数据查询链路中的性能是关键,而在关键链路中推行向量化执行、并选择列式数据计算会是一种正确的选择。


ospp:您认为该项目对于高校学生来说最大的挑战是什么?

王延楠:这个课题本身并不算特别困难,但是需要高校同学对TuGraph本身足够熟悉:在我们提到的"查询链路"中根据当前TuGraph数据库的特点实现高效的解决方案。因此我觉得最大的挑战就是要同学们在课外多花一些时间,来熟悉图数据库、TuGraph的基础知识,这是有一定的学习曲线的。

ospp:在学生报名和申请阶段,您更重视申请学生哪些能力或特质?您是如何评估学生申请的?
王延楠:我会首先考虑同学是否真正对TuGraph以及上述课题感兴趣,因为兴趣让同学自驱,这是他们能实现目标的最好助力。
其次是同学是否足够聪明,准确地说是思维要敏锐一些,才能在Infra的开发中事半功倍。
我的评估标准是上述两点,结合同学们平时跟我的沟通和最终的proposal,我会给每个申请同学排名,然后择优录取。

ospp:当前是项目开发的初期阶段,学生的开发工作是否如期开展进行?您和社区为学生提供了哪些方面的指导和帮助以引导学生更好融入社区?
王延楠:目前来看进展比较顺利,我主要是帮助同学们厘清思路,让同学们尽快熟悉TuGrpah本身和这套"向量化"改进方案。
当前我指导的同学是管昀玫,她以优异成绩从南开大学毕业,在9月份会去往美国深造。目前她正好有足够的时间投入该项目,我们的项目在七月初正式开始,目前来看完成了整体的设计和一些基本数据结构的定义,昀玫同学主动钻研,花了不少时间帮我们出了一些远程编译调试的文档。

ospp:首次以导师身份参与开源之夏,您的体验如何?这种面向高校学生为主体的开源活动对社区、开发者有什么积极影响?
王延楠:我之前指导过一些实习生和校招同学,这与在开源社区中指导在校学生还是有些区别;我想最大不同可能是开源项目的特质:没有太多商业压力的限制,我们的方案会更朴素美观;我在与同学合作过程中、在方案设计讨论定夺阶段,也会尽可能让同学们把思路打开,让我和同学们之间的连接变得更紧密也更和谐。
我相信人是渴望自由的,得益于开源项目"自由"的特质,我期望这些在开源项目中实现的feature能让社区的同仁们感受到这种自由。

#建议与期望
ospp:对于高校学生、开源新手来说,如何选择开源项目?参与开源项目对于个人发展有哪些潜在益处?

王延楠:对于新手,我倒觉得不如功利一点,选择知名度高的、业界的热点,因为这种项目往往后面有比较强的资源支持,在代码质量、文档丰富程度上会更好些。

参与这些开源项目,既能获得一些个人硬实力方面(代码能力、文档能力、对技术的sense)的成长,又能在软实力(沟通能力、融入某个项目所对应的圈子)上有所提高。


ospp:相对应地,新生代的开发者能为开源和开源项目带来哪些新的视角和创新?

王延楠:新生代的开发者代表了未来。

同学们在高校中接受了一些本科阶段或研究生阶段的教育, 这些教育往往与时俱进,所以他们不免带着这些新知识来审视我们的开源项目,我是期望同学在开源项目中发挥自己"新生代"的优势的,比如为TuGraph、以及其他开源项目找一找更新颖的场景,以及在这些场景中有哪些新技术可被应用。


ospp:对于开源之夏活动本身以及活动未来的发展有什么期望?

王延楠:希望开源之夏能越来越好,在国内外都有广泛的知名度的,这是开源之幸。

END
专栏编辑:HungryFish
校对:校大山、王延楠
制图:GoodWhite


欢迎关注TuGraph代码仓库✨

TuGraph-DB 图数据库

https://github.com/tugraph-family/tugraph-db

TuGraph-Analytics 流式图计算引擎

https://github.com/tugraph-family/tugraph-analytics

TuGraph-AGL 图学习引擎
https://github.com/tugraph-family/tugraph-antgraphlearning



最后修改时间:2024-07-26 09:33:08
文章转载自TuGraph,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论