暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

MVP 开放麦 | Copilot 服务“老兵”,GPT 开发却要把“小白”放在心里

Azure云科技 2023-09-27
225


*本栏目分享 MVP 的个人观点,

所有内容仅供参考与交流,不代表微软的意见和立场。

🎙️

人工智能高速落地,从部署秘籍到用例实操,「经验」在这一迅疾迭变的领域变得尤为关键。Azure 云科技全新推出MVP 开放麦栏目,邀请各行各业的微软 MVP 分享最新观点与洞察。


首期开放麦递给 MVP 王豫翔。拥有20余年编程经验的他,也一直致力于分享 Azure AI 相关技术,专注在人工智能领域技术创新,尤其是自然语言对话方向的颠覆性机会。本期开放麦,王豫翔通过他在企业的实践与实验,分享了他对于人工智能副驾与大模型开发的思考。



Copilot 的含义是副驾驶。副驾驶是什么意思?坐在副驾上,给驾驶员一些建议。而驾驶员是谁?他是一名具有开车能力的人。换言之,开车的必须是一名具有驾驶能力的人, Copilot 给出建议但需要驾驶员根据现场的路况、交通标志、人流车流、安全驾驶条件等自己做出正确判断。

没错,Copilot 和导航软件非常类似,给您一个建议,但是最终您要自己判断。所以我说的陌生人其实是领域陌生人,Copilot 不适合为对领域知识的陌生人提供服务。

看到这里,虽然你可能还没有用过 Office Copilot,但是不是已经有了一点认知:Office Copilot 帮你完成文章编写,文档总结,邮件回复等等仅仅是一个建议,而不能取代您。不知道对您来说这是一个好消息还是一个坏消息(偷笑)



Copilot 最适合的场景

是为内部老手优化提效


我们想象一个场景:我编写了一个帮助销售编写营销邮件和文档的写作 Copilot。如果您是销售,您期望怎么用?假设你们公司设计了一个非常强大的自动化 CRM 系统,您直接告诉写作 Copilot:帮我给 Leo 写一份推销我们公司最新的 CRM 系统的邮件?但是写作 Copilot 又怎么会知道你们公司的价值主张,您要推销的 CRM 的亮点,解决客户的哪些痛点呢?所以首先销售要自己了解要推销的产品的亮点和价值,然后告诉写作 Copilot,并提醒写作 Copilot 采用什么样的口吻、和阅读者的体验进行邮件编写。并且销售自己还需要最后检查一次编写的邮件有没有出现所谓的幻觉(hallucinations)


我们再看一个场景,您收集了大量的法律法规文档,然后构建了一个司法 Copilot。然后你尝试问了一下问答,司法 Copilot 洋洋洒洒地给出了看上去非常专业的回答。但是你想想,在 Copilot 的概念下,谁最合适用?是最终的当事人吗?首先我们肯定不能保证 GPT 不会出现所幻觉(hallucinations),所以我们不能肯定司法 Copilot 洋洋洒洒给出的信息肯定正确。所以您的使用者是一个对法律不了解的当事人,他会不会出现因为你字多所以你是对的这样的幻觉呢?所以司法 Copilot 最合适的使用者应该是法务人员,他们可以快速的判断出司法 Copilot 给的答复是不是合理,司法 Copilot 的价值是减少了法务人员从浩如烟海的文档、案例中找到合适的内容,并进行总结归纳,而不是为对法律不了解的人提供司法解读服务。



上述两个虚构的场景,相信已经展现了这一论断的内涵——大模型的 Copilot 在当下最适合的场景应该是企业内部的员工助理,用于内部赋能而非外部服务。


反过来,当企业想要在以下领域使用 Copilot 时,就需要对巨大挑战有所准备:


其一,对外客服对外客服是一个典型的领域知识陌生人,他们不具有判断 Copilot 输出质量的能力,他们只能认为 Copilot 的输出是具有官方的立场。所以如果我们不能控制 Copilot 的精度,就会对使用者带来困恼。


其二,知识精度要求极高这种场景下的关键是用户对知识的验证的成本比较高。比如药理知识助理,Copilot 极有可能构建出让专业人员都不容易发现的幻觉,所以你要怎么控制 Copilot 的可信输出是这类场景的极大挑战。



GPT 开发的关键在于

让产品完成技能与大模型的“Chat”


如果说 Copilot 对“老兵”帮助更大,那 Open AI 的另一个杀手应用 ChatGPT 却似乎恰恰应当以“小白”为开发对象。

先分享我所在企业内部的一个实验:我们用 Azure Open AI 做了一个跟原生 ChatGPT 的体验感几乎完全一模一样的应用接着在公司内部寻找了130个志愿者,并对他们未来2个月的对话和行为数据进行分析。篇幅原因,这里只分享与结论最相关的活跃分析结果。

我们发现,大部分人的累计活跃时间都没有超过十天。只有很少用户累计使用了四十天以上,而使用四十天以上的人群数量和五十天的人群数量差不多。这意味着用户的使用习惯一旦被养成,他对应用的依赖性就会出现。同时也可以说明,原生 ChatGPT 的应用对大部分人是没有粘性的


为什么在130个人里面只有很少的一部分人会产生粘度,为什么只有少数岗位的人员长期使用 GPT?我们在试验的最后给志愿者寄出了一个问卷,这个问卷上只有一个问题:


非常感谢您参与我们两个月的 ChatGPT 使用分析,我们想请您回答一个问题,在回答这个问题之前,您需要了解:

目前 GPT 并不能帮助你实现复杂的数学计算,也不能帮你浏览网站,更不能语音交互,并且不能输出图文视频媒体和链接,还不能产生文件,最最关键的缺点是他给出的答案还不一定准确。

在您理解这些限制的背景下,您希望这个并不完美的人工智能可以在您的工作中帮到您做什么?您只能回答一个场景。


非常开心发出去了130张问卷,有效的回复也是130张。我们发现希望 ChatGPT 可以帮助自己写文案是绝大多数的人的意愿。也就是说,那些使用率不高的人实际上他们也是希望 ChatGPT 能够帮助他们去编写文案,所以我们对这些人又做了一次深入的访谈:现在的 ChatGPT 为什么无法帮助您实现写文案呢?


这次访谈的回复主要集中在:

  • 我不知道要写什么

  • 我想写的东西我表达不出来

  • 我不知道怎么样让 ChatGPT 用合适的内容和风格帮我编写文案


现在我们所有的数据分析实际上是告诉我们一个很有意思的一点:就是大部分人其实都能理解 ChatGPT 主要是帮助我们处理一些文字上的工作,但是这些人中又分了两类人群

第一类人群自身有很强大的文案的编写能力,有很好的文字功底,这些人其实并不需要 ChatGPT 帮他们去编写文案,他们对 ChatGPT 的需求往往是询问一些概念,帮助他们更好的编写文案。

另一人群的专业和职业并不是文字工作者,但是偏偏他们又需要经常编写一些文案。比如:给客户写一份产品介绍、写一份市场分析报告,做一个商机分析报告,在会议上阐述自己的观点,为拜访客户准备相应的话术,但是因为他们本身缺乏文字的功底因此他们没有办法告诉 ChatGPT 他们想表达什么,他们希望 ChatGPT 帮他们对哪些内容进行做创作。

所以现在我们团队认识到:ChatGPT 如果可以有效地帮助那些不会写文案的人写文案——也就是写作领域的“陌生人”——就可以对更大人群产生吸引力。

沿着这一思路,该场景中的 “Chat+”设计思路的应该是“Chat+文案创作技巧”。所以我们企业内部设计了一个叫写作工具,这个工具已经内置了大量企业需要的文案技巧,比如:AIDA、PAS、4U 等技巧。营销人员只要描述他们想传达的内容,比如产品介绍、企业愿景使命、会议的价值、服务内容和用在场景,然后我们的工具就可以通过内置的大量企业营销文案技巧通过【问题(P) – 痛点(P) – 解决方案(S)】、【产品特征(F) – 优点(B) – 功能特性(F) – 优点(B)】、【价值命题(VP) – 展示(D) – 转化(C)】为员工编写一份优质的文案。

也就是说,产品团队完成了写作技巧和大模型之间的 Chat,而用户只需要和我们的产品 Chat。通过产品用户最终完成了 Chat+写作技巧。

该内部写作工具的上线后,我们再次做了一场实验,在原先130位志愿者范围我们又增加了100名志愿者,这次依然是两个月,所有的数据都告诉我们一个非常惊喜的结果:所有的活跃数量都超过了20天,也就是说:最差的情况下,一周员工至少有两次会使用这工具辅助自己的工作。


王豫翔

Microsoft AI MVP

王豫翔, 拥有20余年编程经验,Microsoft AI MVP,一直致力于分享 Azure AI 相关技术。曾在多个大型研讨会担任讲者,包含 TechEd、Tech Summit、Ignite China 、AI Bootcamp 等。专注人工智能领域技术创新,尤其是自然语言对话方向的颠覆性机会。



微软最有价值专家(MVP)是微软公司授予第三方技术专业人士的一个全球奖项。30年来,世界各地的技术社区领导者,因其在线上和线下的技术社区中分享专业知识和经验而获得此奖项。MVP 是经过严格挑选的专家团队,他们代表着技术最精湛且最具智慧的人,是对社区投入极大的热情并乐于助人的专家。MVP 致力于通过演讲、论坛问答、创建网站、撰写博客、分享视频、开源项目、组织会议等方式来帮助他人,并最大程度地帮助微软技术社区用户使用 Microsoft 技术。


更多详情请点击阅读原文登录官方网站:

https://mvp.microsoft.com/zh-cn

文章转载自Azure云科技,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论