
「数据」一直在业界流行,人们称其为价值巨大的宝矿,对于业务提升、趋势预测,甚至是人工智能、机器学习都有核心意义。但是,管理数据,并从数据中获取价值是难题所在,就像一盘珍珑棋局,等待高手破解。
今年8月,大数据公司Databricks宣布以380亿美元的估值筹集了16亿美元H轮融资。投资方明星云集,Counterpoint Global领投,Baillie Gifford、ClearBridge Investments、UC Investments、贝莱德、a16z、老虎环球基金、T. Rowe Price、美国富达投资集团跟投。其中,硅谷知名风投a16z连续七轮投资,一路从A轮融资陪伴到最新的H轮融资。
此时距离Databricks上一轮10亿美元融资完成仅仅不到7个月,那轮融资的投资方不仅有综合基金公司「富兰克林邓普顿投资基金」,还集齐了云计算、企业服务巨头,包括亚马逊、微软、Alphabet旗下的Capital G、以及Salesforce Ventures。
其联合创始人、CEO Ali Ghodsi骄傲地说,“从某种意义上而言,我们每六个月就上市一次。”Databricks也向媒体表示,计划今年内IPO,并表示公司已经做好IPO准备。
Databricks成立于2013,总部位于旧金山,是一家基于云计算的大数据软件公司,提供用于数据集成、数据清洗、数据管理以及其他服务的基于Spark的云服务。
本世纪初,美国加州大学伯克利分校有一位出色的计算机科学教授Dave Patterson,他为学生提供实验室和办公空间,让学生进行头脑风暴和协作,后来这里诞生了强大的开源分布式查询和处理引擎Apache Spark。此后,几位Spark早期成员,共同创立企业型公司Databricks,并构建了新的专有引擎「Ignite」。

Databricks管理团队
Databricks基于云计算提供The Databricks Lakehouse Platform平台,帮助客户将数据、分析、AI进行统一集中管理。这一平台结合了数据湖与数据仓库技术,提供数据仓库中常见的数据管理与性能支持,但是同时具备数据湖的低成本、灵活对象存储特点。
基于数据湖技术Delta Lake、ETL、机器学习、数据科学、Databricks SQL技术、平台安全与管理技术,Databricks这个统一的平台消除了此前将分析、数据科学、机器学习分隔开的数据孤岛,简化了数据架构。这一平台基于开源技术和开放标准构建,因此拥有极高的灵活性。同时,其原生协作功能可以加速跨团队工作与创新。

在商业化方面,大部分开源软件的商业模式是,在开源平台提供免费软件,对高级功能、高阶服务收费。
而Databricks将其商业模式总结为「SaaS开源」,提供完全免费的Databricks开源版本,同时通过提供基于云的SaaS版本,在开发以及软件运行、运营和托管方面向客户收费。
「SaaS服务有很多企业感兴趣的特征,比如可靠性、可及性和可扩展性。」
Databricks表示其在全球有超过5000个企业与组织客户,基于Databricks SaaS来实现大规模数据工程、协作数据科学、全生命周期机器学习和业务分析。典型客户包括壳牌、Comcast、CVS Health、汇丰银行、T-Mobile、Regeneron等。
除了客户数量与增长,行业常用ARR(年度经常性收入)衡量SaaS企业健康情况,计算方法是将合同经常性收入规范化为一年期的价值。在宣布最新一轮融资时,Databricks透露其ARR已经达到6亿美元,相比2020财年的4.25亿有大幅增长。
技术层面一个最重要的趋势是云计算,任意两台机器之间可以全速通信,他们也可以与存储系统、数据湖全速通信。但是,很多企业,尤其是非互联网技术企业不擅长处理云端数据问题,从数据的采集、汇聚、处理,到数据的挖掘、可视化、应用各个过程。
针对这一需求,目前市场上的企业有不同的模式。当前市值942亿美元的Snowflake基于数据仓库提供云端大数据产品,但是数据仓库的问题在于,视频、音频等数据类型无法存储在数据仓库中。
此外,对于大数据这个核心赛道,各个大公司也发布了相应的产品,比如谷歌旗下的Cloud Dataproc、亚马逊旗下的Amazon EMR、微软的Azure HDInsight。

在激烈的竞争中,Databricks的核心战略是押注人工智能、专注云计算、坚持SaaS。
Databricks基于数据湖提供SaaS产品,其战略是押注人工智能。Ghodsi认为从数据的角度,AI与分析具有相似之处,涉及数据的准备、理解、使用,两者唯一的区别是数据分析是向后看,而AI是面向未来,向前看的。同时,随着企业数字化转型加速,行业正被自动化,机器学习的应用越来越广泛。
这家公司也是坚定的云计算拥趸,Ghodsi给企业CIO的建议是,「确保你构建的任何事情都是多云的,各个云供应商都有很多创新。他们财力雄厚,正在进行一场军备竞赛,所以要确保你构建的东西是多云的。」
Ghodsi透露,曾经有客户提出支付2000万美元,希望为他们提供本地版本,但是这一提议被拒绝,「我们坚定地只做云版本」。
Databricks一直做的是云版本的SaaS,并且只做SaaS。
「勇往无前是使公司真正获得成功的唯一途径,因为如果你只是以些许不同的方式来做同一件事情,大公司便会吞并你,他们会复制你的战略并做的更好,因为他们有更多的资金和工程师。对我们来说,我们只有SaaS,我们只是在后台不断更新产品。」
参考:
1. 揭秘Databricks成长故事:看准云技术,他创建了一家市值280亿美元的公司|GGV投资笔记第九十一期,GGV纪源资本
2. Data Alone Is Not Enough: The Evolution of Data Architectures,a16z

END

推荐阅读:
2021年Q2营收2.8亿美元,市值超300亿美金的The Trade Desk靠什么营收同比涨超100%?
市值超300亿美金的Hubspot,如何成为全球数字化营销领域的巨量引擎?
往期榜单:
欢迎联系交流:小新新 i-xiaoxinxin
↓↓↓↓↓点击下方“阅读原文”,下载企名片APP




