很多用户误以为湖+仓=湖仓一体,可能是因为湖仓一体整合了湖和仓各自的优势,所以误认为湖仓一体就是原有湖和仓的简单整合而已。
我们站在技术架构的角度看待这个问题可能更容易得到答案。过往建设数据湖采用 Hadoop,建设数仓采用 MPP 数据库,因为 Hadoop 和 MPP 本身是无法兼容的,所以很难想象 Hadoop+MPP 简单粗暴的等于湖仓一体会是怎样诡异的架构,在实践中只能通过 Hadoop+MPP+统一管理组件进行逻辑整合,这其实是我们常说的“逻辑湖仓一体”、“湖仓分体”。所以,就像西红柿+鸡蛋≠西红柿炒鸡蛋,湖+仓≠湖仓一体,他们本质上是三种不同的事物,湖仓一体的架构与现有的湖和仓都不一样。湖仓一体的流行架构是存算分离,一份数据,多个计算引擎可以共享同一份数据。这种架构解决了 Hadoop+MPP 湖仓分体形成的数据孤岛。偶数由数据库顶级项目创始团队于 2016 年创立,是国家级专精特新“小巨人”企业。专注于云数据平台产品和解决方案,自主研发云原生分布式数据库 OushuDB 及实时湖仓数据平台 Skylab。总部位于北京,在上海、南京、广州、武汉等地设有分支机构。偶数服务了国家电网、中国移动、建设银行等众多世界 500 强客户。获得国际著名投资机构红杉中国、腾讯、红点中国与金山云的四轮投资,是微软加速器和腾讯加速器成员企业。被评为福布斯中国企业科技 50 强,Gartner Cool Vendor,IDC Innovator。
点击下方阅读原文下载行业报告