
ChatGPT横空出世,你还没玩儿过吗?这个聊天机器人已经火到刚刚被程序员问答社区Stack Overflow封杀了。
以防你还不了解,ChatGPT是OpenAI开发的一个大型预训练语言模型。它是GPT-3模型的变体,GPT-3经过训练,便可以在对话中生成类似人类的文本响应。
但ChatGPT又不只是另一个Siri这么简单,上百万名用户各种稀奇古怪的问题都没难住它。
写小作文?不在话下。
敲代码?也没压力。
甚至还能抖机灵:让它打印大狗,它就能用颜文字拼成狗。
写论文、考SAT、改bug……大家开发出了ChatGPT的各种玩法,甚至有人说ChatGPT可能取代谷歌等搜索引擎。
但Stack Overflow为什么马上就宣布禁用ChatGPT?因为它生成的回答正确率太低了。
ChatGPT真的很擅长一本正经地胡说八道,很多回答看起来有道理但细节都不准确,对于真正想要通过提问找答案的人来说,验证成本太高。
和机器对话代替复杂工作,可以更有价值
除了和“懂王”ChatGPT进行问答游戏,实际上你还可以和机器做更深层次的互动,解决日常工作中的真实问题,比如数据分析。
传统的数据分析工具的学习门槛很高:要么学写代码,至少花几个月入门;要么学习拖拉拽的BI工具,新手课程也需要1-2周。
这就导致没什么人真正会用这些工具,大量的工作只能交给专门的数据团队完成。在分析师资源极为抢手的情况下,有大量的数据需求被搁置了。

北极九章正是为了满足业务人员大量灵活、临时的数据需求而研发的一款产品。只需在搜索框里输入问题,北极九章就可以实时地完成数据查询、计算和可视化工作。
除此之外,北极九章还能根据用户搜索的问题自动拓展推荐相关的数据,并自动下钻探索数据背后的原因。
整个过程在数秒之内就能完成,从此老板再也不担心我拍脑袋决策~
戳视频看业务人员如何用北极九章完成数据分析👇🏻
自研NL2SQL技术,让机器正确理解问题
让机器真正理解人类的问题、做出正确的回答,是个长久以来的难题。
仍以ChatGPT为例,它的知识只来自训练数据中的统计规律,而不是任何类似人类对世界复杂和抽象系统的理解,因此不免做出错误回答。
如果要实际落地应用到特定的商业化场景,就需要重新训练模型,这将大大增加成本——这是当前机器学习难以突破的局限。
然而对于企业应用,尤其是数据分析工具来说,返回准确的答案是必要的。
北极九章采取了另一种路线,通过自研的NL2SQL技术,基于模型完成分词、时间维度分析、操作符解析等操作,并根据规则树和数据词典,满足不同行业、不同场景、不同企业的语言习惯和“黑话”。
即便用户的问题模糊,机器也能尽可能准确地理解用户的意图,并“翻译”成SQL语言查询数据库。
举个例子:
阿迪十月同比?
阿迪:模糊的词,阿迪达斯?阿迪达斯休闲?阿迪王?
十月:模糊的月份,哪年十月?
同比:这是对比问法
补充:对比什么指标?问题中缺失相关信息
北极九章能根据用户查询的意图以及模型配置,将问题补全并查询。
用户想问的是“阿迪达斯和阿迪达斯休闲2022年10月营业额同比”
“阿迪十月同比”的搜索结果

关于搜索式的数据分析工具,或许你还想知道:
复杂问题能不能问?
哪些数据可以搜?
谁适合用搜索分析数据?
有哪些成功案例?
……
了解更多用搜索做数据分析的玩法,这周五下午,欢迎来直播间坐坐👇🏻

北极九章

















