这个春天,“东数西算”成为科技圈最热的话题!
发改委、工信部等四部门近日联合印发文件,同意在京津冀、长三角、粤港澳大湾区、成渝、内蒙古、贵州等八地启动建设国家算力枢纽节点,并规划了十个国家数据中心集群,这标志着“东数西算”工程正式启动。
乘着“东数西算”的政策东风,数据中心、服务器、操作系统和数据库相关软硬件产业将迎来巨大的发展机遇。其中,基于云原生的分布式架构数据库,凭借湖仓一体、存算分离、高弹性、可扩展等优势,成为“东数西算”工程备受关注的发展方向之一。
HashData作为一款云原生、现代化、面向多种数据分析场景的高性能分布式关系型分析数据库,支持超大规模的集群架构,可以实现跨集群、跨云中心的数据访问,能够满足“东数西算”多元化布局需求,助力企业高效、便捷管理数据资源。
为云而生 激活数据资源潜力
近年来,我国数字经济规模不断扩大,数据已成为数字时代的基础性战略资源。未来随着智能化技术的普及,数据的开发、共享、管理和流通将成为趋势。
今年全国两会《政府工作报告》提出,“完善数字经济治理,释放数据要素潜力,更好赋能经济发展、丰富人民生活。”
“东数西算”意味着数据要素的大规模、跨地域流动。要管好、用好这些数据,作为数据承载与处理的基石,数据库在其中发挥着重要作用。
当前,企业对数据库的需求越来越复杂和多样化。与此同时,传统数据仓库在使用中存在着运维工作量大、重复性高、难以实现数据快速交付等难题,成为不少企业数字化转型过程中必须面临的挑战。
近年来,新技术和数据仓库架构不断在演进,在行业内涌现出一系列新的创新技术理念。在创新技术的推动之下,云端数据仓库逐渐受到业内关注和认可。
国家发改委高技术司透露,“东数西算”工程支持技术创新融合。鼓励数据中心节能降碳、可再生能源供电、异构算力融合、云网融合、多云调度、数据安全流通等技术创新和模式创新,加强对关键技术产品的研发支持和规模化应用。

HashData数据仓库采用以Snowflake、Databricks和Google BigQuery为代表的业界领先的云原生大数据系统设计理念,围绕着对象存储和抽象服务构建,通过元数据、计算和存储三者分离,多集群共享统一数据存储层的架构,最大限度发挥云计算优势,利用云平台的弹性+分布式的特点,实现快速部署、按需伸缩、不停机交付等,大幅降低企业进行大数据分析的门槛,推动数据民主化。
HashData的元数据服务通过全球可访问的分布式系统提供,负责数据持久化的对象存储通过HTTP RESTFUL接口提供广域网(互联网)访问能力,中间的计算层则实现了完全无状态。在这种架构下,HashData能够在不同的数据中心和云平台创建不同的计算集群,并让这些集群看到统一的数据逻辑视图,从而实现跨数据中心和云平台的数据共享,有力支撑“东数西算”工程。
HashData已经完成与国内主流公有云和私有云平台的适配对接工作,并积极参与到信创工作中。2020年底,HashData与华为鲲鹏云实现了兼容性认证;2021年8月,HashData与EasyStack ECF Arm 云基础设施平台完成兼容认证。此后,随着客户在信创环境下的产品需求逐渐增多,HashData陆续完成了麒麟操作系统认证(鲲鹏版+飞腾版)、飞腾芯片兼容性认证、统信操作系统认证(飞腾、腾云、鲲鹏916、鲲鹏920)。

高效便捷 赋能产业转型升级
当前,随着工业互联网、产业互联网、无人驾驶等行业应用不断落地和扩展,应用产生的数据规模和增量加速增长,数据管理应用领域变得越来越复杂和碎片化,对数据基础软件提出了更高的要求。
作为一款企业级数据库和数据仓库产品, HashData继承了PostgreSQL和Greenplum Database丰富的分析功能,并结合云平台的特性进行了改进和优化,为企业提供强大的数据分析能力,帮助企业用数据洞察业务趋势。
SQL: HashData数据仓库实现了ANSI SQL 2008标准和2003 OLAP扩展,支持标准的JDBC和ODBC 接口。业界常用的ETL和BI工具都可以支持HashData数据仓库作为分析引擎。
用户自定义分析: 通过支持用户自定义数据处理函数, HashData数据仓库大大扩展了自身的分析能力。支持的语言包括PL/Pgsql 、PL/C 、PL/Python 、PL/Java和PL/R。
机器学习: HashData数据仓库原生支持Apache MADlib ,一个开源的、基于SQL的in-database机器学习库。Apache MADlib基本包含了所有常见的机器学习方法。
多模态数据分析:除了分析结构化数据之外,像手机应用、社交媒体和物联网等新型场景的出现,半结构化数据也越来越多,如JSON、XML以及地理信息数据(GIS)。HashData云数据仓库能够对这些结构化、半结构化高价值密度数据进行统一管理和分析,为客户提供多模态数据分析能力。
总结与展望
HashData云数仓能够对接主流公有云和私有云平台,让数据在不同数据中心、不同云服务商之间进行无缝的流动、管理和分析,有效应对业务和数据多变的环境,助力企业更好融入“东数西算”产业发展。
HashData致力于用领先的技术消除企业数据管理和分析的“痛点”,为用户提供完全托管的数据分析服务。通过功能完善的管理控制台和强大的数据分析能力, HashData可以让企业轻松部署超过上百个节点的数据仓库集群,帮助各领域客户高效率、低成本建立数据应用体系。HashData希望打造一个让更多人能够更轻松地挖掘数据价值的平台,高效释放数据要素价值,有力支撑“东数西算”全国布局。
下一步,HashData将持续加大技术研发,不断完善产品功能,紧抓机遇,积极投身“东数西算”战略工程,助力更多合作伙伴“上云用数”,走好数字化转型之路。
END




