暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

不让Fivetran独美,Airbyte新晋独角兽

老阎杂货铺 2021-12-31
1877

在2021年圣诞前夕,开源数据集成厂商Airbyte宣布获得1.5亿美金的B轮融资,估值达到15亿美金,一个新的现代数据技术栈独角兽冉冉升起。作为一个2020年才成立的公司,Airbyte做对了什么使得它这么值钱?作为一个B端的数据技术公司,2年时间达到15亿美金级别,在历史上是非常罕见的。下面让我们来了解一下Airbyte的历史和它做的事情。



Airbyte基本情况




  • 公司名:Airbyte

  • 成立时间:2020年1月(YC孵化器孵化)

  • 创始人:John Lafleur, Michel Tricot

  • 融资历史:

    • 2021年2月  种子轮 520万美金  Accel投资

    • 2021年5月  A轮  2600万美金 Benchmark领投

    • 2021年12月 B轮 1.5亿美金 Altimeter领投

  • 最新估值:15亿美金

  • 人员规模:约40人,2022年目标200人

  • 公司业务:数据集成



Airbyte发展历史




如果看现在的Airbyte,可以看到它成立于2020年1月份,在YC孵化器孵化了3个月的时间。但是在YC孵化的时候,他们的公司还不是做数据集成的,当时的核心业务是帮助客户做能够即使在有广告屏蔽的情况下也能收集到广告相关的数据并进行分析。但是疫情的影响让这个产品从市场必须变成了可有可无。但是两个创始人在与不同的客户沟通的时候,发现客户都面临数据集成的问题。虽然市场上已经有了一些比较成熟的基于云的数据集成产品(实际上就是Fivetran,具体可以参看估值56亿美金的独角兽Fivetran - 重新定义数据流 。但是对于这些客户来讲,数据集成并不是一个已经被很好的解决的问题-核心问题是数据来源太多了,Fivetran虽然已经有100多个connector,但是还是有很多长尾系统的数据没办法接入。于是两位创始人决定调转方向,开始做数据集成方面的创业。这里需要说明一下,两位创始人John Lafleur和

Michel Tricot都是在行业有多年经验的老兵。John是连续创业者,曾经创立过Anaxi, StreamNation, 而Michel则是安客诚旗下的LiveRamp的核心研发和rideOS的创始成员。在B端创业,产品和客户经验还是比较重要的。


在决定转向后,两位创始人采访了大量的既有数据集成方案的客户(3个月采访了45个客户),去了解客户在使用既有产品方案的问题,发现客户虽然已经有了云端的数据集成工具,但是还是需要自己去开发和维护不同系统的连接器,显然这对客户来讲是个沉重的负担。另外,有些客户因为数据安全带问题,也需要私有化部署,这时候纯云端的方案也会存在问题。基于这些问题,两位创始人发现一个开源的数据集成方案似乎能够解决这两个主要的问题。于是Airbyte团队决定做一个开源的数据集成产品,并且在2020年9月推出了第一个有6个连接器的Airbyte MVP版本。这个版本功能比较受限,只支持全量同步,不支持增量同步,目标是从客户那里收集反馈来排自己产品的优先级。


MVP版本推出来后,每周都有来自很多客户的要求,11月份比10月份的客户数翻了一番,到2021年2月份,每个月都有100%点用户增长,每个月部署的客户数达到了500,在这个时候Airbyte拿到了自己的天使轮的融资。尽管天使轮的融资没有公开宣布,Airbyte还是得到了非常多VC的关注,在2月份Benchmark就开始联系Airbyte,通过与Benchmark的几轮讨论,在2021年5月,Airbyte完成了自己2600万美元的A轮融资,这轮融资由Benchmark领投,8VC, Accel, SV angle和YC跟投,并且Elastic CEO-Shay Bannon, MongoDB的CEO-Dev Ittycheria以及LiveRamp的创始人Auren Hoffmon作为个人投资者也参与了投资。


有了资本的助力,再加上客户的活跃反馈,Airbyte在2021年继续飞速的发展,在Airbyte的官网上,有一个自己与主流的ETL/ELT工具的对比,如下图:


从这个图中可以看到,虽然短短的不到两年时间,Airbyte已经支持超过120个数据源,表格中计划到2021年底支持200个数据源,今天是12月31日,我在开源社区粗略数了一下,目前是180多个数据源,应该已经超过Fivetran和Stitch,不得不说社区的力量真是强大。


从这个表格看,客户数Airbyte也超过了Fivetran和Stich,由于我在加入了Airbyte的slack,目前Airbyte的slack社区中的connector-development频道的人数是4643人(截止到2021年12月31日)。Airbyte的开源项目现在是5090个star。考虑到这是一个2020年9月份才开始MVP的产品,不得不说这个发展速度真是惊人。


正是因为Airbyte高速的发展,让Airbyte在2021年12月20日宣布完成了B轮1.5亿美金的融资,公司的目标是成为数据移动的事实标准。公司的北极星指标是提供最可靠并且无处不在的数据移动平台。最新一轮融资由Altimeter资本和Coatue管理(一家低调的对冲基金,投资过喜茶,喜欢重仓科技股)领投,Thrive资本,Salesforce投资,Benchmark, Accel已经SV Angel跟投。



Airbyte为啥能值钱?




在数据集成领域,已经有一个估值超过56亿美金的超级独角兽Fivetran,同时还有被Talend收购的Stitch和欧洲的数据集成独角兽Matillion,Airbyte能快速崛起,其背后的原因是什么呢?


  • 数据生态的复杂性


在数据驱动成为企业的共识的情况下,每个企业都有把自己的数据集中管理和使用的需求。但是每一个企业的信息化建设阶段都不尽相同,这使得需要接入到数据源千差万别。在Fivetran和Stitch之前的数据集成工具,基本上面临的是私有化部署内部系统,由于当时系统大部分不开放,因此当时的数据集成基本上是数据库集成为主,少量的API集成。而Fivetran和Stitch创业的时候,云优先成为趋势,于是这些公司基本上完全抛弃了传统的系统,从云端具有开放API的数据开始集成。这的确非常有价值,如果从现代数据技术栈的角度看,这非常适合新兴的云原生的公司。但是毕竟还有很多公司有遗留系统,也有自己开发的一些系统,这些系统被替换掉的难度非常大,整个数据源系统的复杂度远远超过一个闭源公司自己去对接能够支持的能力,这也是Airbyte发现的机会。


  • 开源社区的力量


发现问题后,就需要考虑如何解决问题。在传统的企业级市场,面向一个相对分散的市场的时候,比较理想的解决方案是成立一个组织,制定标准,比如历史上的J2EE标准等等。然后几个标准制定厂商再根据标准进行自己的实现,基于标准形成一定的垄断,大家去分食整个市场。但是在互联网时代了,工作模式产生了巨大的变化,通过制定标准然后实现标准显然已经不能跟上时代的发展。野蛮人进村的时候,根本就是先形成大家使用的共识,使用的共识就是标准。比如曾经有JEE的标准,但是开源的Spring整套体系基本上让原来的JEE标准没有了什么意义。数据集成这个场景也是一样,散碎的市场,还有很多遗留系统,最方便解决这个问题的方法就是开源方案,通过内核开源,解决数据接入和集成最核心和基础的工作,其余的数据源适配工作,则交给开源社区来去实现。相对共性的,形成对应的connector大家都可以享用并贡献。自己开发的遗留系统,也没有问题,稳定的核心技术不用你开发,你只需要开发对应的连接器,就可以实现数据的集成。因为核心开源,再加上新的容器化技术的加持,私有化部署也不是问题。然后作为核心开源的贡献者和社区管理者,Airbyte只需要继续维护云上的服务,采用和Fivetran一样的收费策略就可以了。


  • 拥抱生态


实际上无论Airbyte,还是Fivetran,大家都是全力拥抱生态的。都是先做好自己最应该做好的事情。数据技术在当前这个阶段仅仅处于爆发的初期,任何一个公司能做好一件事情都不容易了,因此专注做好自己擅长的,然后跟生态对接,充分拥抱生态。Airbyte在创业的时候因为选择了开源,在transform层直接对接了dbt,流式调度可以支持prefect,也可以支持airflow。也正是充分融入生态,才不会孤军奋战,也减少了很多不必要的投入,也容易借力。


  • 资本加持和全球化


当然,一个企业想要发展,资本的助力也非常的重要。Airbyte有了很好的数据的表现,资本的助力能让Airbyte招募到更出色的工程师。目前Airbyte是个全球化部署的团队,这也是疫情世界后一个越来越明显的趋势-技术团队创业全球化,方向确定后,在全球招募合适的员工,远程工作。这样产品开始就有一定的全球化的基因,无论用户群体还是客户群体,一开始就有全球化的基础。



总结




Airbyte的这轮融资给现代数据技术栈的火热又加了一把火,不过还是要更冷静的看待现代数据技术栈的现状。目前看,企业利用数据的需求一定是会越来越旺盛,毕竟全球都进入了一个发展瓶颈期,更精细化的运营是企业能进一步发展的动力,这就需要更好的利用数据。但是目前整个现代数据技术栈,还仅仅是发展到早中期阶段,还远远跟不上企业的需求的要求。我们的世界数据也越来越多元,数据利用的场景也越来越丰富。从这些需求中,找到一个点,专注的做好,然后充分去开放和对接,这样才能够进一步激发生态的繁荣,客户和用户也会从中受益,进而形成正循环。这需要我们所有的从业者从自身做起,踏踏实实做好自己该做的,解决用户问题,在2021年最后一天也让这句话来自勉。

文章转载自老阎杂货铺,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论