gBuilder内测活动圆满收官

图谱学苑 2022-06-10

708

gBuilder是北京大学王选计算机研究所数据管理实验室历经三年研发的知识图谱自动化构建平台。是通过结合NLP技术、机器学习、人工智能、知识图谱、图数据库等众多技术，打造的一个针对结构化数据和非结构化数据的知识图谱自动化构建平台，实现数据向知识的转化。

gBuilder解决了知识图谱生命周期中重难点问题即如何便捷高效的自动化构建知识图谱。知识图谱全生命周期分为构建、存储管理、应用三个阶段。知识图谱的应用和存储管理在业内已有众多解决方案。如我们团队历经十年自主研发的原生图数据库系统gStore（http://www.gstore.cn）、智能问答引擎gAnswer。然而由于知识图谱构建是一项需要花费大量的人力和时间，却不直接体现价值的工作,使得知识图谱构建却鲜有统一化的平台工具，但知识图谱构建却是知识图谱生命周期中最基础、最关键的工作。而gBuilder正是解决知识图谱构建困难点问题而研发的高效平台，打破知识图谱行业“巧妇难为无米之炊”的窘境。

内测回顾

为了保证正式版本的良好体验，gBuilder于2021年10月和2022年4月进行了两轮内测活动。gBuilder的内测活动受到众多朋友的关注，数百位用户积极报名，最终约60位用户入选，我们在此由衷感谢大家的支持。我们在内测过程中，努力发现问题，解决问题，打造简单易用的知识图谱自动化构建平台！

1、提供完善的辅助资料。

我们提供了四讲gBuilder内测培训，分别由北京大学数据管理研究室的师生进行详细讲解。第一次部分：gBuilder介绍、Schema设计；第二部分：数据的结构化构建；第三部分：数据的非结构化构建；以及第四部分：模型重训练

除了培训外，内测为用户提供了丰富的训练数据，在培训中使用的数据为了大家根据培训后再次复现结果，另外提供的细粒度人物关系的练习数据便于大家再次熟悉操作。内测也为大家提供了详细的用户使用手册。尽量使每一位用户体验了使用gBuilder设计知识图谱schema，并构建知识图谱，有自己的数据的用户可以训练自己独属的知识抽取模型。

gBuilder内测的相关课件、用户手册、测试数据请在微信公众号“图谱学院”回复：gbuilder内测 获取

2、提供充分的沟通和交流

除了定期的线上培训交流外，我们建立专门的团队专门服务本次内测，实时修改bug、回答内测用户操作疑问以及收集建议。在内测结束后，为活跃积极的内测用户进行访谈，并发放纪念品。

建议反馈

1、用户对gBuilder总体满意度较高。在本次内测的用户反馈的满意度调查中，全部用户都给出了5星或4星好评，并且超过2/3的用户对我们的课程内容和用户手册给出了5星满分评价。

2、在gbuilder的所有功能中，结构化知识抽取是用户完成度最高也是最喜欢的功能。绝大部分的内测用户完成了从关系型数据库的表结构数据到知识图谱的图数据抽取的全部流程并表示满意。

3. 非结构化知识抽取，尤其是可用个人化数据进行自定义训练的非结构化知识抽取模型是用户最期待的功能。由于我们的信息抽取模型使用通用领域数据进行训练，因此在通用领域数据上的效果得到了较多用户的认可。但开放域的信息抽取的问题一直是学术界的研究难点，并且大规模模型的续联需要大量的计算资源，因此在一些垂直领域即使加入了模型的自定义训练功能，抽取效果仍有待提高。

4. 据同时参加两次内测的用户反馈，本次内测新增加的抽取结果一键链接gStore图数据库实例功能是体验最好的功能之一，可以直接以图的形式对抽取结果进行查询，极大优化了用户体验。

5. 经过本次内测使用，用户也对公测版本的gBuilder平台有了新的期待，其中呼声最高的是丰富内置抽取模型和上传并使用自己的知识抽取模型，这也充分说明了信息抽取问题的难度和大家对此问题的关注，接下来我们也将对开放域的信息抽取和事件抽取等问题继续进行深入研究。

下阶段计划

gBuilder接下来的工作重点是针对现有版本的bug修复，以及Beta版本的开发：

1、在Schema可视化设计模块支持对OWL文件的导入和导出；

2、增加知识融合模块，实现实体融合，关系融合和属性融合；

3、增加知识质量评估模块，分析出不满足Schema设计中属性值域、定义域、必要性等设置的三元组数据信息

4、增加用户自定义模型注册功能，用户可以通过该功能将自己训练的模型注册到平台并进行使用。

本次内测将会给gBuilder带来一个更好的开始，我们相信未来会有更多的人通过gBuidler实现知识图谱构建，构建和训练自己的知识图谱。我们也希望用低代码、便捷的构建知识图谱的方式，降低门槛，惠及广大学习和从业人员！

正式版本的gBuilder预计在今年7月进行公测开放注册，敬请期待！在此之前我们将采用邀请制方式注册个人/企业账号，如有定制需要，您可联系：gstore@pku.edu.cn进行审核开通，快来联系我们哟！

软件数据抽取

文章转载自图谱学苑，如果涉嫌侵权，请发送邮件至：contact@modb.pro进行举报，并提供相关证据，一经查实，墨天轮将立刻删除相关内容。

gBuilder内测活动圆满收官

评论