暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

Databricks 收购 Iceberg 母公司 Tabular,网友:Hudi怎么说?

GreptimeDB 2024-06-06
247
点击下方「预约」按钮,先行预约本次直播。

开源改变世界。

当地时间 6 月 4 日,美国大数据和人工智能技术公司 Databricks 在其官网宣布,同意收购数据管理公司 Tabular——这是一家由 Apache Iceberg 原始创作者 Ryan Blue、Daniel Weeks 和 Jason Reid 创立的公司。
Databricks 表示将与 Tabular 共同努力实现开放湖仓的共同愿景。其将通过整合 Apache Iceberg 和 Delta Lake,让双方社区密切合作,为 Lakehouse 带来格式兼容性,也为了更好地整合客户私有数据为 AI 服务。

Databricks 联合创始人兼首席执行官 Ali Ghodsi 表示:“Databricks 率先推出了 Lakehouse,在过去四年中,世界已经接受了 Lakehouse 架构,它结合了数据仓库和数据湖的优点,帮助客户降低 TCO、拥抱开放性并更快地交付 AI 项目。不幸的是,Lakehouse 范式被分为两种最流行的格式:Delta Lake 和 Iceberg。Databricks 和 Tabular 将与开源社区合作,随着时间的推移使这两种格式更加接近,提高开放性,并为客户减少孤岛和摩擦。”
据了解,随着原 Iceberg 团队的加入,Databricks 将大大拓宽 Delta Lake UniForm 的未来。
“去年,我们宣布推出 Delta Lake UniForm,为这两种格式带来互操作性,我们很高兴将开放数据 Lakehouse 格式的领先者聚集在一起,使 UniForm 成为统一每个工作负载数据的最佳方式。”
在 6 月 10-13 日举办的 Data+AI Summit 中,Databricks 还将详细介绍二者深入合作的细节和未来规划。DataFun 技术社区了解到,今年的 Summit 又是爆满的一年,而且内容会更加 LLM,值得期待。
该起收购事件在数据圈掀起轩然大波,社区热议:
“统一格式将给所有人带来好处?”
“Delta Lake 和 Iceberg 强强联合之后,Hudi 是否地位尴尬了?”
“我就说,Iceberg 会赢。”
对于这一事件,DataFun 技术社区认为,这不是某一家企业或者某一个产品的胜利,而是开源的胜利。而白鲸开源 CEO、Apache 基金会成员郭炜表示:“Tabular 去年刚融了 20M,估值之前在 100M-200M,1B-2B 是一个很好的价格,这是最终市场对开源的认可,是一场开源的胜利。众所周知的是,砖厂开源的 Delta Lake 很多核心功能都没有开源,而 Apache Iceberg 以更全面的功能、更简单的配置、更开放的社区赢得更多的人的支持。初创公司开源 vs 大厂的半开源,最终开源赢得了胜利!”
另一数据 PaaS 巨头企业 Snowflake 和 Databricks 竞争已久,并计划于 6 月举办 Data Cloud Summit,那么 Data Cloud Summit 又会有哪些动态呢?格睿科技作为一家开源时序数据库厂商,对 Snowflake 和 Databricks 的最新动态也很关注,欢迎大家来到直播间听听在数据领域深耕多年的 Greptime CTO——孙宁和其他专业人士的深度解析 👏
那他们会聊些什么呢?先看一下预告:
随着数据规模的不断增长,Snowflake 和 Databricks 在数据管理和分析领域展开了激烈角逐。Snowflake 和 Databricks 此次发布有哪些亮点?它们在产品战略和技术路线图上体现出了哪些差异化思路?未来几年,哪些关键因素会改变行业游戏规则?
6 月 12 号 & 14 号,格睿科技 Greptime 将携手云器科技、Datafun 及众多行业专家,直击发布会现场,为你带来深度解读(吃瓜前线)~

还没预约的朋友,点击下方按钮预约本次直播 🎙️:

关于 Greptime

Greptime 格睿科技专注于为物联网(如智慧能源、智能汽车等)及可观测等产生大量时序数据的领域提供实时、高效的数据存储和分析服务,帮助客户挖掘数据的深层价值。目前主要有以下三款产品:


GreptimeDB 是一款用 Rust 语言编写的开源时序数据库,具有云原生、无限水平扩展、高性能和融合分析等特点,帮助企业实时读写、处理和分析时序数据的同时,降低长期存储的成本。我们提供 GreptimeDB 企业版,支持更多企业特性和定制化服务,如有需要欢迎联系我们:15310923206(同微信)。


GreptimeCloud 是一款全托管的云上数据库即服务(DBaaS)解决方案,基于开源时序数据库 GreptimeDB 打造,能够高效支持可观测、物联网、金融等领域的应用。用户可以通过内置的可观测性解决方案 GreptimeAI 全面掌握 LLM 应用的成本、性能、流量和安全等情况


车云一体解决方案 是一款深入车企实际业务场景的时序数据库解决方案,解决了企业车辆数据呈几何倍数增长后的实际业务痛点。多模态车端数据库结合云端 GreptimeDB 企业版帮助车企极大降低流量、计算和存储成本,并帮助提升数据实时性和业务洞察能力。


GreptimeDB 作为开源项目,欢迎对时序数据库、Rust 语言等内容感兴趣的同学们参与贡献和讨论。第一次参与项目的同学推荐先从带有 good first issue 标签的 issue 入手,期待在开源社群里遇见你!扫码添加小助手备注“技术交流群”立即加入讨论吧~


Star us on GitHub Now: 

https://github.com/GreptimeTeam/greptimedb


官网:https://greptime.cn/

文档:https://docs.greptime.cn/

Twitter: https://twitter.com/Greptime

Slack: https://greptime.com/slack

LinkedIn: https://www.linkedin.com/company/greptime/


点击下方链接🔗关注 GreptimeDB,了解更多技术干货👇

往期精彩文章:


👇 点击下方阅读原文,立即体验 GreptimeDB!

文章转载自GreptimeDB,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论