暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

聊聊ChatGPT与AI|CnosDB×CMU老友记回顾

CnosDB 2023-03-03
259

为思考和探讨ChatGPT和AI的前沿发展,解析ChatGPT的大语言模型及强化学习技术内幕,并讨论ChatGPT及相关方向在中国市场落地与商业化的可能性,CnosDB与CMU校友此前联合开展了一次“老友记”Meetup活动,为了方便各位爱码士们回顾,CC也将这些精彩内容整理成文啦~


时至今日,AI算法尤其是自然语言处理技术已被应用于许多产业,如医疗语音的转写、在线教育、图像识别和生成等等。诸如此类广泛的实际的AI算法融资落地的经验使得业内人士积攒了很多关于人工智能落地的想法和经验,从而让他们对人工智能持有不同的态度。CnosDB与CMU联合开办的“老友记”上,各从业者也在分析和评价ChatGPT现状后对产业以及整个大环境的未来作出了思考。


ChatGPT从野蛮生长到规规矩矩

ChatGPT是一款以transformer为基础的超大语言模型,基于深度学习算法,它可以实时生成文本——“与人对话”。文本的高质量、高开放性与通用性离不开auto regressvie这一特点,从ChatGPT1.0到3.0版本,其模型每一次都有超过十倍的增长。而3.5版本更是做了针对reinforcement learning with human feedback——人工反馈做了强化学习,因此对话性更加显著。

在开发初期ChatGPT中的伦理问题还是比较明显的,比如有人可能用来写一些暴力、色情等相关内容,而在3.5版本中,Open AI团队专门训练了分类器以筛除这些不健康内容;ChatGPT也开始选择拒绝回答涉及伦理的不安全问题,可以说人工智能安全性得到了提升。

但安全性提升的背后是大量人力:Open AI团队在肯尼亚与印度募集了非常多的工人去做有关伦理性、安全性、涉黄涉暴等内容的标注,因为深度学习需要样本,目前只能靠人工标注来分离出不健康内容的样本,这就使得标注人员由于天天接触这些色情暴力的内容而出现不同程度的心理健康问题。

因此,ChatGPT乃至所有AI技术的安全性与伦理性不得不引起讨论与思考。


从ChatGPT看未来


ChatGPT的出现让研究人员看到了通用人工智能的希望,AI技术可以平滑进步,渐进式达到“通用智能”的标准。冷静派研究人员肯定ChatGPT的算法逻辑,但并不认为它出现了“共情”。目前让人惊叹的“共情”并不来自于其模型本身“产生”的感情,而是训练数据所指导出的参数,而这恰恰是大众与专业人士的区别——大众只就眼前的对话结果觉得它已经非常智能并有“感情”了。

也正因为大众如此惊叹,ChatGPT的出现激活了平静、高无波澜的国内投资市场,让更多人想要去创业,也让投资机构更活跃,利好了国内产业界与创投生态。而成功与否,关键还在于三点:人才、资本与时间。基于我国的行业人才储备,结合国外企业合作,在资金力量雄厚的条件下,不断升级到商业化水平是有希望的,但业内人士对最终成果面向的场景又抱有不同观点。

一部分人认为通用智能距离我们尚远,如果根据ChatGPT和目前已有的送餐机器人等适用单一日常交互场景的AI技术,未来各个垂直领域的人工智能大有可为;而另一部分人则认为单一行业数据太小,要耗费大量成本做特定行业的大模型不如做通用模型,但技术与成本上都要面对更大的压力,需要找到更好的解决方式。于是,业内人员想从其他模型着手,看诸如自动机器学习模型(Auto Machine Learning)有没有向AI方向发展的新通路。


ChatGPT与Auto ML


首先,ChatGPT和Auto ML的定义不同:ChatGPT致力于像人类一样交流,其功能与目标就是浅层理解与正常聊天;而业内对于Auto ML的要求是自动开发接近甚至超越专家水平的高精度模型。因此二者的目标与目前看来的完成质量都不尽相同。另一方面,Auto ML的目标赋予了它重要的存在意义,模型的自动化开发、面向特定业务场景进行调整以及实现大量的自动化都需要Auto ML技术。目前无论是阿里、华为,还是腾讯,都会自研一些适合自自身业务场景的Auto ML系统或工具来根据它们的业务场景特点进行微调。比如阿里已经在商品推荐业务中自研一些比较优秀的Auto ML系统,再如华为专注于智能运维等等。

然而,纵使ChatGPT与Auto ML有着诸多差异,二者还是存在联系的。既然Auto ML的目标是自研高精度模型,那么不妨尝试利用Auto ML技术来实现ChatGPT机器学习模型的自动优化、自动调整甚至其他功能的的拓展——使用自动化机器学习模型来实现自研过程。如果可以解决企业核心技术与数据的安全保密问题,那么这可以变成企业技术发展的一个方向。


ChatGPT与产业


ChatGPT的技术迭代着实令人惊艳,但目前来看投入产出比不高,过高的成本使其难以为产业效力。一方面,目前许多任务依靠简单技术即可实现,没有必要寻求较为昂贵的ChatGPT技术;另一方面,针对人工处理的复杂任务,目前ChatGPT和AI还无法做到完全替代;这两方面原因致使ChatGPT现阶段还无法落地产业。因此,对于创业者来说,自主研发实现商业化将举步维艰,技术层面的问题非朝夕即可解决。

更重要的是,对所有创业者来说,接近用户比技术领先更需注意。在底层模型相似的客观条件下,各创业者是否了解、理解和能够满足客户真正的需求才是能否打造产品优势的根源。与此同时,在技术创业中,数据壁垒也能帮助创业者竞争领先位置。可以说,时间和用户数据才是技术创业中最大的护城河。


对于人工智能的态度


或许ChatGPT的逻辑性已经十分优越,但正如此前冷静派人士所说,人不是纯理性的,这就使缺乏感性、只讲逻辑的ChatGPT达不到“智能”的水平,但可以确定的是,未来ChatGPT这样的大模型一定会走向多模态,五年之内可以预见中国态成果。在技术层面,我国会稍落后于西方世界,但也不需妄自菲薄,只要保持AI向善的初心,在思想解放与产业发展的这个春天,我们都会沐浴到新技术的春风。

读者朋友,看完这些大咖对ChatGPT的理解,你觉得自己是降临派、拯救派还是幸存派呢?你又是怎么看ChatGPT呢?ChatGPT如何同我们的时序数据库关联呢?欢迎到下方留言区谈谈~


 参与CnosDB社区交流群:


扫描下方二维码,加入CC进入CnosDB社区进入社区交流,CC也会在群内分享直播链接哒











🚪由此下方【阅读原文】即可传送CnosDB GitHub开源社区🔜🎟 各位爱码士🧙‍♂️尽情享受开源世界吧。

文章转载自CnosDB,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论