一起来看看一年一度的 databricks 大会,发布了哪些重点内容,以及有什么启示。
另外可以先看看去年的,然后对比下今年的进步大模型时代最懂数据的公司 databricks
1、首先来看下 databricks 是怎么来组织内容的,Databricks 是围绕上面技术栈来展开。覆盖 AI,查询引擎,应用和集成等等。可以看到 databricks 已经不是数仓公司或者AI 公司,而是面向 Data+AI 全栈公司。

2、发布免费版本,100M 的quota,永久免费,free forever。

3、发布 lakebase,通过收购 NEON,将 NEON 的 PG 数据库能力也纳入整个平台。主打的能力是 存算分离 和 branch 功能。这两个功能特别适合Agent 使用。(可能代表了数据库在 AI 应用里面的一个关键能力)

3.1 branch 底层用的是 copy on write 的能力

4、databricks apps,这个是去年发布的,今年GA。比较亮点是超过 2500 个用户已经用了。
databricks apps本质上解决的问题是和 databricks 数据平台深度集成和一体化的问题,体验更好。



5、发布agent bricks,agent 管理和多 agent 框架
5.1、agent bricks 是构建在去年收购的 mosaic AI 上面。

5.2、最核心两个功能,一个是回答不好的,可以人工纠正,持续改进。

5.3、另外一个是多 Agent 框架,一个大的任务分解给各个小的 Agent。

6、新版本mlflow3,支持大模型

7、serverless 形态支持 GPU

8、支持 MCP

9、发布iceberg managed tables,功能全,宣传是最好的 catalog,(Databricks收购了 iceberg 背后的公司, 对标 snowflake 意味非常明显)


10、unity catalog metrics GA,去年发布的,核心是 catalog 里面有业务指标,方便业务人员和 AI 理解。

11、发布unity catalog discover,内部市场也有权限限制,按业务概念分类。非常方便内部分享。

12、spark 新增 real time model

13、spark declarative pipelines

14、lakeflow declarative pipelines

15、lakeflow designer,这个非常有意思
15.1、通过自然语言就可以把pipeline 建起来。(同时可以修改对应的代码,估计是先生成代码,然后展示)

15.2插入一张图片,就会按照图标的格式样式去生成表格。(所以里面还夹杂了大模型识别和总结图片)

16、databricks SQL 性能提升 25%,价格不变

17、收购bladebrige,发布lakebrige 迁移服务

17.1 大模型加持

18、AI/BI(AI 加持的 BI),集成自动预测能力


19、AI/BI 用的unity catalog 的语义层

20、专门给业务人员发布 databricks One,避免复杂度

21、这一次 databricks 发布可以看到明显往Data 应用在转型,包括 lakebase,agent bricks,databricks App,unity catalog metrics 等等。






