1 .一种基于异构分布式知识图谱的大数据处理方法,其特征在于,包括:
根据异构分布式知识库的数据结构,构造所述异构分布式知识图谱的节点表和关系
表;
根据图谱计算请求,确定图谱计算场景,确定所述图谱计算场景所需的节点的类型和/
或属性,以及边的类型和/或属性;
根据所述图谱计算场景所需的节点的类型和/或属性,以及边的类型和/或属性,从所
述节点表和关系表中,提取与所述图谱计算场景对应的至少一个计算节点;
从所述异构分布式知识图谱中过滤出与所述至少一个计算节点对应的节点数据;
对过滤出的所述节点数据进行数据处理,得到基于异构分布式知识图谱的数据处理结
果;
其中,所述节点表包括:各节点的标识、各节点的类型、各节点的属性、节点的类型集合
和属性集合,所述关系表包括:各边的起始节点标识、各边的目标节点标识、各边的类型、各
边的属性、边的类型集合和属性集合。
2.根据权利要求1所述的方法,其特征在于,所述异构分布式知识图谱存储分布式存储
在多个设备中;
从所述异构分布式知识图谱中过滤出与所述至少一个计算节点对应的节点数据,包
括:
从每个设备中过滤出与所述至少一个计算节点对应的节点数据;
所述对过滤出的所述节点数据进行计算,得到基于异构分布式知识图谱的计算结果,
包括:
对从每个设备中过滤出对应的节点数据进行计算;
汇总每个设备的计算结果,得到基于异构分布式知识图谱的计算结果。
3 .根据权利要求1所述的方法,其特征在于,在对过滤出的所述节点数据进行数据处
理,得到基于异构分布式知识图谱的数据处理结果之后,还包括:
将所述计算结果添加到所述节点表中的属性集合中,或者关系表中的属性集合中;和/
或,
将所述计算结果添加到所述节点表中对应节点的属性中,或者关系表中对应边的属性
中。
4 .根据权利要求3所述的方法,其特征在于,所述根据所述图谱计算场景所需的节点的
类型和/或属性,以及边的类型和/或属性,从所述节点表和关系表中,确定与所述数据计算
场景对应的至少一个计算节点,包括:
根据所述图谱计算场景所需的节点的类型和/或属性,以及边的类型和/或属性,在节
点表中查找节点的标识,在关系表中查找起始节点标识和目标节点标识;
根据节点的标识、起始节点标识和目标节点标识,确定所述至少一个计算节点。
5 .根据权利要求1所述的方法,其特征在于,根据异构分布式知识库的数据结构,构造
所述异构分布式知识图谱的节点表和关系表,包括:
加载用于构建异构分布式知识图谱的节点数据源和边数据源;
识别所述节点数据源的数据结构以及边数据源的数据结构;
根据节点数据源的数据结构,构建所述节点表;以及根据边数据源的数据结构,构建所
权 利 要 求 书
1/3 页
2
评论