暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

图谱动态|学苑周刊 NO.122

图谱学苑 2022-11-30
317

本期将分享近期全球知识图谱相关

行业动态、会议讲座、综述推荐

—--| 行业动态 |--—
阿尔茨海默疾病分类学知识图谱

为推动全球健康的学术研究与应用实践,耶鲁大学和北京大学全球健康发展研究院与艾登科技合作,通过医疗大数据平台,为阿尔茨海默疾病研究提供了阿尔茨海默疾病分类学知识图谱。本次研究通过优质的疾病分类学图谱以及医疗服务与管理数据,建立起了中国阿尔茨海默疾病负担评价体系。据了解,为此次研究助力的艾登科技是一家DRG赛道医疗大数据服务解决方案提供商,公司专注于提供医疗大数据平台搭建和数据分析服务。

https://62j.net/1126X

Squirro与Semantic Web Company合作创建复合AI产品

近日,增强智能解决方案提供商 Squirro 宣布与知识图谱提供商语义网公司建立战略全球合作伙伴关系,创建新的复合 AI。

新复合AI解决方案是一种为企业提供机器学习(ML),自然语言处理(NLP)和知识图谱技术的解决方案。它将来自各种来源的内容与用户的意图和上下文相结合,智能地增强决策。它提供针对特定个人量身定制的个性化结果,并在用户需要时精确交付。Squirro的Insight Engine提供NLP和ML,根据用户的意图对句子级别的内容进行分类。它提供了一个用户友好的界面,并从交互中了解用户正在寻找的内容和搜索的上下文。语义网公司的知识图谱技术(PoolParty)将人和意图与数据联系起来,它将内容中的概念上下文化,并将它们链接到其他有意义的概念和内容以扩展搜索结果。

复合 AI 平台通过将不同的 AI 技术(如 ML 和语义 AI)与图技术融合,从任何内容和数据中生成见解。通常,复合 AI 可提供更快、更准确的结果,并缩短价值实现时间,这是在没有复合 AI 的情况下可实现的目标的重大进步。

https://62j.net/1126W
医疗器械行业+知识图谱

在医疗器械企业中存在着多源异构数据,各个数据模块间由于存储方式的不同,数据类型的差异等因素,使得原本存在关联的数据无法进行关联,进而形成了“数据孤岛”。应用知识图谱,能够将不同来源、不同结构的数据类型进行抽象建模,基于可动态变化的“概念,实体,属性,关系”数据类型,实现各类数据的统一自动化建模,同时实现知识搜索,问答,失效归因分析等功能,成功唤醒“沉睡知识”,为企业赋能。

达观知识图谱根据企业的实际业务场景构建产品的细分知识库,将多源异构数据中有价值的数据知识以及历史经验进行提取,进一步构建医疗器械产品相关的知识图谱,再通过图谱产品的图谱搜索与智能问答等功能,使得工程师可以从海量且异构的数据中快速且准确的找到所需的数据,不仅充分利用了数据的关联性与相关经验的沉淀,还进一步的提升了企业内部的知识共享能力等软实力。达观数据基于自然语言处理与知识图谱技术与企业携手构建的知识图谱平台,通过知识图谱的搜索、问答、可视化探索与文档溯源功能,为企业新入员工快速熟悉产品与老员工的知识沉淀,还可利用图谱进行数据分析,提升医疗器械的研发效率。与此同时,有效促进企业数据的标准化工作,为企业发展带来长远的影响。

https://62j.net/1126Y


—--| 会议讲座 |--—

CNCC 2022

CNCC(中国计算机大会)自2003年首次举办以来,经过十八届的发展,已成为中国计算机领域首屈一指的年度盛会,是CCF会员年度团聚的重要平台。

今年,第19届CNCC将于12月8-10日在线上贵阳国际生态会议中心召开。大会主题确定为“算力 数据 生态”,并将重点在保持多样性、聚焦热点前沿话题、平衡学术界和产业界参与等维度展开讨论。

详情请访问:
https://ccf.org.cn/cncc2022

ICCBI 2022

第五届计算机网络、大数据与物联网国际会议(ICCBI 2022)将于2022.12.09-10在印度举行。在这个数字时代,物联网(IoT)、大数据和计算机网络致力于提供新的创新贡献,重点关注开发和部署广泛的智能和网络信息系统。智能物联网和大数据平台允许联网设备与体积、种类和速度的核心值进行通信,这反过来又导致大数据和物联网与先进的机器学习和其他先进技术的集成。本届网络、大数据和物联网计算机国际会议(ICCBI 2022) 将提供一个跨学科平台,将科学家、研究人员和院士们介绍和交流与物联网、大数据和计算机网络有关的最新研究工作和成果主题。 

详情请访问:
http://icocbi.com/2022/


—--| 综述推荐 |--—
TaLM

本周推荐的是发表于IJCAI 2022的一篇综述:Table Pre-training: A Survey on Model Architectures, Pre-training Objectives, and Downstream Tasks,对现有表格预训练模型的模型设计、预训练目标和下游任务进行了归纳和概括,并提出了若干挑战和未来发展方向。作者来自微软和上海交通大学等。

表格以特定的结构组织和呈现数据,是现实世界中一种重要的数据格式。参照自然语言处理领域预训练模型的处理范式,利用未标注的表格数据进行自监督学习的表格预训练模型TaLMs在表格分类、表格问答、表格搜索等一系列下游任务中取得良好的效果。相比于自然语言,表格还拥有更多独特的信息和多样的结构,因此近年来也有若干工作针对表格设计特殊的模型结构和预训练目标,代表性工作如TaBERT、TaPsa、TURL等。

本文认为,结构化的表格不仅提供了一种探索神经网络结构的独特视角,并且能够促进语义解析、逻辑-文本生成等跨领域应用的发展。文章从模型结构、预训练目标和下游任务几个方面对当前的若干表格预训练模型进行了分类,对读者快速把握当前表格理解的主要任务和主要方法会有所帮助。

TaLM的主要下游应用任务:

对于未来研究的关键挑战,作者提到了充分利用多种特征、统一下游任务框架、探测TaLM中学到的知识、探究LM和TaLM的一致性与差异、提高大表上的效率等几个方面。




更多链接


图数据库 gStore 1.0 版本正式发布
墨天轮国产数据库11月排行:gStore位列国产图数据库前三
图数据库入门系列 | AI4DB入门与思考-北京大学杨磊博士
华为天才少年|王选所毕业生杨磊
图数据库入门系列 | 图流研究入门-北京大学苟向阳博士
北京大学王选计算所数据管理研究室招聘启事
自主可控图数据库gStore新版0.9.1发布
公开课程 | 图数据管理与挖掘 最终讲-第九讲:面向知识图谱的自然语言问答
图说《人民的名义》
导师访谈 | 邹磊:对数据科学以及本科生科研的思考

内容:胡喆媛、代雪佩、薛冰聪、王图图

编辑:王图图

排版:王图图




诚邀您加入我们的gStore社区,我们将在群内解决使用问题,分享最新成果~


请在微信公众号图谱学苑发送“社区”入群~或扫码入群



免责声明本文全部内容均来源于网络开放信息整理,如有侵权,请联系删除

欢迎关注北京大学王选计算机研究所数据管理实验室微信公众号“图谱学苑“
实验室官网:https://mod.wict.pku.edu.cn/
微信社区群:请回复“社区”获取

实验室开源产品图数据库gStore:
gStore官网:http://www.gstore.cn/
GitHub:https://github.com/pkumod/gStore
Gitee:https://gitee.com/PKUMOD/gStore





文章转载自图谱学苑,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论