

大语言模型+数据分析
是泡沫吗?
“ChatGPT与我们业务的结合点在于,我们是通过问答方式输出数据内容,让用户更快、更好地理解和使用数据。”北极九章创始人刘沂鑫分析道。“我们跟传统BI最大的差异点在于用户交互体验方面。传统BI产品多是需要复杂配置的软件,而我们是把用户和数据的交互模式放到一个‘搜索框’里。”
类似的业务模型,可以在国际市场上找到样本。北极九章的对标,是创办于2012年的ThoughtSpot,这家BI软件提供商推出了全球第一款数据搜索引擎。
ThoughtSpot拥有大量数据及分析模型,因此,其能将“数据分析师”的思维与视角,直接赋予业务端人员。
“更低的数据获取门槛、更灵活敏捷的数据获取方式,ThoughtSpot已经成为下一代BI里跑得最快的一家。目前,他的年营收已达到4亿美元左右。而Tableau等传统BI龙头,也开始在‘搜索’的方向上做探索。”
ThoughtSpot的快速成长,让“搜索式数据分析”在海外市场得到验证。而能否在国内落地,需要看与国内市场的匹配程度。
在北极九章成立以来的近6年时间里,刘沂鑫回忆,“市场变化越来越明显,机会点也多了起来。”不仅是产品优势,国内企业在数据利用度、数据利用周期等方面的诸多痛点,都是北极九章的机会所在。
第一, 国内部分企业已建立起数据认知,并积累了一定量的优质数据。
前几年,很多客户的需求还是‘先把数据治理做好’‘先把数据收集起来’。到近几年,我们接触的很多头部客户,已经拥有了足够多的、很好的数据。他们现在面临的一个困惑是‘怎么把数据很好地用起来’。”与此同时,新一代企业管理者也更倾向于将数据作为决策依据,并且愿意在这方面探索、投入。
第二,国内数据分析市场还处于孕育阶段,更优质的解决方案仍在培育中。在数据治理、数据采集、数据存储等更为明确的需求之上,很多企业开启了“如何用好数据”的课题探索。当前,国内主流的数据分析工具面临 “使用门槛高、操作人员欠缺经验”“分析结果离业务有一定距离”等痛点;市场仍正处于发展早期。
第三,“建立大量看板”“IT人员主导”的传统数据分析方式,存在沟通周期长、在业务端落地周期长等痛点。
传统数据分析流程为业务提出需求、IT人员搭建看板、数据分析师消化分析后形成洞察。然而,“IT人员不懂业务,业务人员不会操作”,双方往往需要多轮沟通;而不同部门需要不同维度的数据,长此以往,企业积累了大量的冗余报表。
此外,进入数字化时代,企业数据量井喷,传统的数据分析方式无法再支撑业务;更无法快速产出具有借鉴意义的数据洞察。
第四,国内数据分析师匮乏,数量远无法满足市场需求。 数据分析师是形成数据洞察的必经出口。
“国内数据分析师的人数只有美国的1/10左右,而我们国家受过高等教育的人口是美国的两倍,可以看到国内其实有更多人需要数据,企业对数据分析师的依赖和需求也始终存在。”

从“人找数据要洞察”,
到“洞察通过简单交互找到人”
“人人都是数据分析师”这一产品理念的触点,需要回到创始人刘沂鑫的职业经历。这些经历在很大程度上,也是北极九章全球视野得以形成的关键因素,并塑造了北极九章打造产品的底层逻辑。
2013年,从伯克利毕业后,刘沂鑫任职于美国最大的金融地产公司。在服务过的多家金融行业客户中,一个来自全球最大投资银行的“系统金融性风险”项目令他印象深刻。
据刘回忆,这家金融行业巨头在做每一个决策前,都会对数据进行分析。“我曾经和他们的一位数据分析师对接工作,这位分析师拥有普林斯顿大学IT博士学位,在他身上我发现了当时的一个典型情绪:大家普遍认为基础的数据分析工作太过繁琐。”
显然,市场在期待一种更为简单、轻松的数据分析方式。“哪怕像高盛、摩根士丹利等全球顶尖企业,都希望以更快、更简单的方式分析数据,希望在一定的数据分析基础上进行更深度的分析,而不是从学习编程语言开始理解数据。”
“企业需要一款能让员工自己搜索、分析数据的产品。”在这样的产品构思下,刘沂鑫回国,创立北极九章。
早期,北极九章所面对的国内市场上,并无一家国产“搜索式数据分析”厂商。这样的市场环境,使得刘沂鑫在创业早期,就将竞争的目光放到全球市场,并奠定了北极九章的第一个产品逻辑——用国际软件“通用化”“智能化”的标准设计产品。
国际软件与国内软件的区别何在?“更多是在产品理念而非产品功能上。”刘答道,“很多global软件,会花几十年时间把某项功能变为一个通用的软件功能,通用功能对产品团队的能力要求会更高;而国内很多企业会做定制化开发的功能。” 落到“人人都是数据分析师”的理念本身,就是将一个具有3年到5年左右经验的数据分析师的能力,抽象、复制为通用的软件功能。
开放的市场绝不会局限于单一的解决方案,北极九章在创业初期顺风顺水。在2018年收获了小红书、重庆百货等种子用户,直到第一版产品进入正式交付环节。
在真实环境应用时,大量未曾预料到的问题暴露出来。这塑造了北极九章的第二个产品理念——重视数据安全,满足更严格的产品要求。
北极九章最早交付的企业是一家世界500强央企,“他们对于系统的安全性、计算机等级保护等各方面要求都很高,但我们在设计第一款软件的时候,并没有把这些需求点考虑进去,更多考虑的是国际软件的设计方式。”此外,不仅要满足国内企业本地化部署的需求,在压力、反应性能、安全反渗透等尚未涉及领域的测试也要以国际标准进行。“这样严格的测试,在我之前任职的公司里从来没碰到过。”刘沂鑫坦言。
第三个理念,是建立起一套“好的搜索式数据分析引擎”标准。
从产品能力看,一款好的数据问答产品的标准是什么?“当用户搜索3个问题,但都得不到满意的答案后,就会跳出去不再使用。而我们要做到的是,面对近100个提问,能回答99%以上的问题。”
在这三大产品逻辑的支撑下,北极九章逐渐积攒起行业口碑。天眼查数据显示,2021年,公司连续完成数千万元的天使轮、Pre-A轮融资,资方包括梅花创投、盈动资本、绿洲资本。并迭代推出了1.0-3.0产品。
2023年3月,北极九章3.0产品DataGPT发布会上,刘沂鑫介绍道,北极九章到2.0-3.0阶段迭代的核心是“更智能”。“我们对产品的基础功能进行了大量优化,以帮助用户形成更好的体验。在任何用户想要应用的场景,DataGPT也都能自动生成更多内容。”
整体上,DataGPT的亮点主要来自三个方面。
第一,在自然语义的交互上做了更多优化。DataGPT的语义分析和理解能力更上了一个台阶,实现了人和机器能更自然地对话。
第二,优化了Auto-Insight自动分析引擎。真正做到了将一个拥有3-5年经验的数据分析师的能力,浓缩为产品能力。同时,将产品集成到WPS、移动端、PC端、IM软件等端口,用户可以利用自然语言在更多场景中获得数据分析的能力。
不仅如此,DataGPT还能够实时监测数据,并推送业务变化预警。“相当于实现了从‘人找数据要洞察’,到‘洞察通过最简单的交互模式找到人’的改进。”
第三,与大语言模型相结合。“这也代表了我们对未来的想象——不仅能更好地理解客户、更自然地进行对话,还有望实现从自动数据建模、到自动生成报告的能力。”刘沂鑫总结道。

一种“未来式解决方案”
如何在当下产出价值?
对于国内数据分析行业来说,基层数据系统的搭建和数据治理进程,始终是影响行业进程的一大因素。也是到最近一年,北极九章才真正打开局面、迈入发展加速期,“今年一季度,我们的合同金额、客户数量都有了一定的涨幅。很多原来购买国外软件的客户,也开始愿意花相对高的价格购买北极九章的产品。”
而这样的进展,不仅是由“好产品”这一单一维度的要素所驱动。北极九章对DataGPT的定位是“一款未来式的解决方案”;一款未来式解决方案首先要做的,是寻找合乎实际的价值场景。
在产品发布会上,北极九章将DataGPT的价值分为短期、中期、长期三个维度;显然,现阶段DataGPT的价值发挥聚焦于“短期价值”。
刘沂鑫透露,目前DataGPT已投入商业化,收获了诸如国内最大的保险经纪公司、服装零售企业及最大的快消连锁企业等KA客户。
以保险公司为例,刘介绍道,在使用DataGPT前,该公司应用的是传统数据分析方式——先做决策,由数据分析师收集、分析资料并输出洞察后,再进行决策、项目排期、核对项目流程等环节。“他们做一个‘保险理赔险’的项目周期通常超过了20天。接入DataGPT后,公司在2天之内找到了需要优化流程的省、市公司,这对他们来说可能是几百万元的成本优化。”
其次,在商业化和应用方式上,一款未来式的解决方案应当着眼于当下。DataGPT与其他数据分析产品的差异点在于,能够随时在任何想要的场景中输出更精准的洞察。这必须要解决数据来源问题。因此,在产品落地实施上,北极九章选择与行业上下游厂商紧密合作。
一方面,为了要保证得到优质的数据来源,获取多源异构数据,北极九章会与诸如MarTech等更多赛道厂商达成合作。
“这个场景下,关键的一环是上一层数据收集。比如在营销方面,为了能灵活调整面向不同人群的投放内容、渠道等,灵活分析运营效果,我们会与MarTech厂商建立合作,他们是拥有数据的人。”
此外,北极九章还覆盖市面上20多种主流数据库,同时,企业能够以自身的数据库为依托,自行上传离线Excel、CSV文件。
另一方面,企业数字化系统的成熟度,是决定其是否会应用DataGPT、以及影响DataGPT价值发挥的另一重要因素。因此,云厂商、数据治理厂商等都在北极九章的合作名单中。
此前,北极九章就与华为云、亚马逊云、腾讯云、移动云等厂商开启合作。云厂商们为其提供了如安全、告警等各方面的高阶服务,及稳定的 API 接口。基于此,北极能够实现自动化扩容和数据的备份存储,运维操作和部署成本都得到了优化。
越做越通用、越做越简单,是TO B市场、乃至整个软件赛道的主流趋势。“搜索式数据分析”带来的更为简单、灵敏的数据分析方式,显然符合市场预期。但市场仍在不断变化。
“5-10年后,数据交互产品和技术形态会发生怎样的变化?新技术会怎样重构数据分析行业?该怎么定义这个市场?我们始终处在一个过程里,这是一件很有趣的事儿。”

北极九章











