本期将分享近期全球知识图谱相关
行业动态、论文推荐

近期,长江航道规划设计研究院利用CiteSpace软件,对“航运经济”研究领域的学术文献进行信息挖掘,构建“航运经济”的知识图谱,进行该领域研究机构、专业人员的合作网络关系分析及其所在领域的交叉关系,梳理“航运经济”研究热点、辨识研究趋势,为研究院开展内河航运经济科学研究和工程应用提供参照。

该研究是研究院首次开展科学文献数据挖掘领域的知识图谱可视化分析研究,能够为未来进一步对绿色、智慧等重要交通热点领域的文献进行挖掘分析,建立可视化的知识图形和序列化的知识谱系从而推进相关领域的科研分析与理解数据背后的学术价值奠定研究基础。在信息爆炸、数据纷杂的时代背景下,该研究将建立与长江航道发展相关的知识系统和学术网络,对研究院开展咨政建言、课题研究、规划编制及工程咨询等工作具有重要意义。同时,结合研究院超算算力以及长江航运大数据分析中心建设规划的实施,该研究成果将进一步丰富长江航道大数据分析与应用的技术研究和应用领域。

Basecamp Research是一家总部位于英国伦敦的公司,该公司根据现有的自然生物多样性的大量知识图谱设计蛋白质产品,近期在 A轮融资中筹集了 2000 万美元。公司将利用本轮资金扩充团队,全面验证内部产品,继续构建医药、营养、农业、消费品等行业的产品组合。

Basecamp Research 正在构建一个复杂的自然生物多样性样本图数据库。通过与大公司合作,生产产品目前涵盖食品与营养、化妆品、制药、生物修复和可持续制造。
本周推荐的是发表于SIGMOD 2022的论文Annotating Columns with Pre-trained Language Models,提出了一种基于预训练语言模型的多任务学习框架进行表格语义标注,作者来自Megagon Labs和Meta AI等。

表格元信息,如表格列类型和列之间关系,对表格理解和各种数据管理任务至关重要。由于这些元信息经常缺失,很多工作致力于学习和推断表格中缺失的元数据信息。
这篇工作关注表格列类型预测和列关系识别任务,提出了一个名为DUDUO的多任务学习框架,基于预训练语言模型,DODUO吸收表格上下文信息得到列的向量表示,通过把两个任务统一建模、知识共享,达到相互促进的效果。文章整体结构如下图所示。

在WikiTable和VizNet两个数据集上的实验表明,DODUO能够在更少的训练数据下达到sota的预测结果,其中多任务学习框架发挥了关键作用。
作者公开了文章代码和数据集,感兴趣的读者可以关注:
更多链接
内容:胡喆媛、代雪佩、薛冰聪、王图图
编辑:王图图
排版:王图图

诚邀您加入我们的gStore社区,我们将在群内解决使用问题,分享最新成果~
请在微信公众号图谱学苑发送“社区”入群~或扫码入群



欢迎关注北京大学王选计算机研究所数据管理实验室微信公众号“图谱学苑“
实验室官网:https://mod.wict.pku.edu.cn/
微信社区群:请回复“社区”获取
gStore官网:http://www.gstore.cn/
GitHub:https://github.com/pkumod/gStore
Gitee:https://gitee.com/PKUMOD/gStore





