暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

星环科技图数据库 Transwarp StellarDB 产品简介

原创 明智健悟 2023-02-17
1065

Transwarp StellarDB 简介

Transwarp StellarDB是一款为企业级图应用而打造的分布式图数据库,不仅可以用于快速查找数据间的关联关系,而且还可以提供强大的算法分析能力。StellarDB克服了海量关联图数据存储的难题,通过自定义图存储格式和集群化存储,实现了传统数据库无法提供的低延时多层关系查询。在社交网络、公安、金融、工业、能源等领域都有巨大应用潜力。

1. 产品背景

图(Graph)是一种由组成的半结构化数据,用于映射事物之间的关系,如人际关系、交易往来、交通道路等模型。属性图(Property Graph)是近年来兴起的一种图模型,可以在点、边上自由定义属性和类型,从而形成社交网络、交易网络等复杂图。

background

传统关系型数据库擅长处理拥有固定结构的表格型数据,数据之间的关联关系需要通过一些JOIN操作来得到。但是,在数据量增长或数据类型复杂时,关系型数据库会存在以下几个瓶颈:

  1. 存在大量JOIN操作
  • 为了获得数据之间的连接信息,关系型数据库不得不通过JOIN的方法来取得“下一跳”节点。大量的JOIN操作不仅对计算资源造成极大浪费,也无法快速返回数据结果。
  1. 固化的数据模型
  • 图数据在应用场景中可能频繁地修改数据模型,关系型数据库在应对这种场景时,对用户的模型设计能力要求极高。

关系型数据库由于数据模型限制而无法适配图场景,图数据库因此孕育而生。相较于关系型数据库,图数据库在以下方面具有优势:

  • 拥有灵活可变的数据结构;
  • 充分利用图的内联信息,可存储规模庞大的关系;
  • 实时返回查询结果。

图数据库把边视作数据的一种,将关系型数据库的JOIN操作转换为图数据库的一次普通查询。在数据量增加时,JOIN操作会急剧增加查询的开销,但图数据库仅会增加少量开销。随着图数据数量增加,单机系统在计算和存储上存在明显瓶颈,分布式图数据库是未来的趋势。

星环科技StellarDB是一款完整的分布式图数据库产品,支持企业级图数据的存储、查找、分析和展现。结合原生存储引擎和计算引擎,StellarDB可以轻松实现数千亿边规模的海量图存储、实时数据插入更新、10层以上深度链路查询,以及复杂算法分析。

1.2. 产品架构

intro1 new

1.3. 产品组成

作为星环大数据平台的重要组件,StellarDB架构主要由以下部分组成:

1.3.1. 存储引擎

图数据以高效的压缩格式存储于星环分布式存储引擎中。借助图分区算法,图数据可按策略分散存储于集群中,拥有良好的可扩展性,并具备存储任意规模图的理论能力。

存储引擎架构为Master-Worker结构,多个Master组成的Master Group负责元信息管理、任务调度、负载均衡等功能;Worker存储图数据,并提供数据读取、更新和删除功能。存储引擎通过Raft协议来保证数据一致性和高可用性。

1.3.2. 计算引擎

借助星环分布式计算引擎Quark的计算分析能力,计算能力随着节点数目增长线性扩展。StellarDB可同时为用户提供实时图查询和离线算法分析,进而支持海量边点的大图分析。

计算引擎和存储引擎同机部署。利用数据locality特性加速图计算和分析任务。计算引擎内置了部分常用图算法,并以RDD的方式提供数据和计算的接口。

1.3.3. 可视化引擎

StellarDB提供网页可交互分析工具KG Explorer。用户可以在界面上输入并执行查询语句,并基于查询结果做进一步的数据分析,或者通过业务数据和图谱模型来构建新图谱。

「喜欢这篇文章,您的关注和赞赏是给作者最好的鼓励」
关注作者
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文章的来源(墨天轮),文章链接,文章作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论