
为了保证正式版本的良好体验,gBuilder于2021年10月和2022年4月进行了两轮内测活动。gBuilder的内测活动受到众多朋友的关注,数百位用户积极报名,最终约60位用户入选,我们在此由衷感谢大家的支持。我们在内测过程中,努力发现问题,解决问题,打造简单易用的知识图谱自动化构建平台!
1、提供完善的辅助资料。
我们提供了四讲gBuilder内测培训,分别由北京大学数据管理研究室的师生进行详细讲解。第一次部分 :gBuilder介绍、Schema设计;第二部分:数据的结构化构建;第三部分:数据的非结构化构建;以及第四部分:模型重训练
除了培训外,内测为用户提供了丰富的训练数据,在培训中使用的数据为了大家根据培训后再次复现结果,另外提供的细粒度人物关系的练习数据便于大家再次熟悉操作。内测也为大家提供了详细的用户使用手册。尽量使每一位用户体验了使用gBuilder设计知识图谱schema,并构建知识图谱,有自己的数据的用户可以训练自己独属的知识抽取模型。
gBuilder内测的相关课件、用户手册、测试数据请在微信公众号“图谱学院”回复:gbuilder内测 获取
2、提供充分的沟通和交流
除了定期的线上培训交流外,我们建立专门的团队专门服务本次内测,实时修改bug、回答内测用户操作疑问以及收集建议。在内测结束后,为活跃积极的内测用户进行访谈,并发放纪念品。
1、用户对gBuilder总体满意度较高。在本次内测的用户反馈的满意度调查中,全部用户都给出了5星或4星好评,并且超过2/3的用户对我们的课程内容和用户手册给出了5星满分评价。
2、在gbuilder的所有功能中,结构化知识抽取是用户完成度最高也是最喜欢的功能。绝大部分的内测用户完成了从关系型数据库的表结构数据到知识图谱的图数据抽取的全部流程并表示满意。
3. 非结构化知识抽取,尤其是可用个人化数据进行自定义训练的非结构化知识抽取模型是用户最期待的功能。由于我们的信息抽取模型使用通用领域数据进行训练,因此在通用领域数据上的效果得到了较多用户的认可。但开放域的信息抽取的问题一直是学术界的研究难点,并且大规模模型的续联需要大量的计算资源,因此在一些垂直领域即使加入了模型的自定义训练功能,抽取效果仍有待提高。
4. 据同时参加两次内测的用户反馈,本次内测新增加的抽取结果一键链接gStore图数据库实例功能是体验最好的功能之一,可以直接以图的形式对抽取结果进行查询,极大优化了用户体验。
5. 经过本次内测使用,用户也对公测版本的gBuilder平台有了新的期待,其中呼声最高的是丰富内置抽取模型和上传并使用自己的知识抽取模型,这也充分说明了信息抽取问题的难度和大家对此问题的关注,接下来我们也将对开放域的信息抽取和事件抽取等问题继续进行深入研究。
gBuilder接下来的工作重点是针对现有版本的bug修复,以及Beta版本的开发:
1、在Schema可视化设计模块支持对OWL文件的导入和导出;
2、增加知识融合模块,实现实体融合,关系融合和属性融合;
3、增加知识质量评估模块,分析出不满足Schema设计中属性值域、定义域、必要性等设置的三元组数据信息
4、增加用户自定义模型注册功能,用户可以通过该功能将自己训练的模型注册到平台并进行使用。







