投资要点
◼ 事件:11 月 30 日,OpenAI 发布免费机器人对话模型 ChatGPT(GPT-3.5 系
列),模型中首次采用 RLHF(从人类反馈中强化学习)方式。模型目前处
于测试阶段,面世一周便已有超过一百万用户使用。
◼ 从受众和技术上看,ChatGPT 在 AI 文字交互模型领域十分突出。与此前
的模型相比,ChatGPT 亮点主要包括:(1)全面免费开放,OpenAI 所有用
户只需输入文字,就可免费调用完成各种事情(如数学计算、debug、写信、
生活问题解答等),实感体验为广泛讨论创造土壤;(2)新增代码理解和生
成能力,彰显技术实力的同时也拓宽了应用场景;(3)加入道德原则。RLHF
训练方式使 ChatGPT 能够识别恶意信息,识别后拒绝给出有效回答。(4)
支持连续对话。ChatGPT 具有记忆能力,提高了模型的交互体验。参考海
外用户实际体验,ChatGPT 对大部分问题的回答都较为合理,对于写信、
写短文等需要创造内容的要求也可以给出较为丰富流畅的文字方案;总体
上,ChatGPT 对话效果令人满意,新鲜感与实用价值使其快速走红。
◼ 工具价值:低门槛、高效的 AIGC 文字内容生产工具。虽有不少声音将
ChatGPT 与谷歌等搜索引擎对比,但由于该模型仍无法很好解决提供虚假
信息的问题,甚至过度猜测用户意图导致回答偏差较大,我们认为其本质
仍偏向 AIGC 内容生产工具。搜索引擎核心是海量信息集合,而非信息创
造;但在“存在标准答案”的领域(如编码、数学计算等),ChatGPT 或将
对搜索引擎产生一定冲击。其次,相比更多面向 B 端客户的 GPT-3,C 端
学习和使用成本低、产出效果好的 ChatGPT 有望助力 AIGC 破圈,并在接
收海量用户反馈的过程中继续迭代,推动 AIGC 文字内容生产走向全民化。
◼ 为何 ChatGPT 能实现如此革命性的变化?通过梳理前几代模型,我们认
为新技术 RLHF 训练方式的引用或是关键:1)从 GPT 到 GPT3:优化主
要来自算力增加(烧钱)。GPT、GPT-2 和 GPT-3 在算法模型并没有太大改
变,但参数量从 1.17 亿增加到 1750 亿,预训练数据量从 5GB 增加到 45TB,
其中 GPT-3 训练一次的费用是 460 万美元,总训练成本达 1200 万美元(数
据来自 21 世纪经济报道和品玩)。虽然训练数据量和算力大幅增加使 GPT-
3 有显著优化,但高额投入也使其只能走 B 端变现。2)变化出现在 22 年
推出的 GPT3.5,技术迭代成优化来源:Instruct GPT(1 月发布)模型中增
加了人类对模型输出结果的演示,并在对结果进行排序的基础上训练,加
上指令调整的帮助,虽然其只有 13 亿个参数,但回答准确率、道德表现却
好于 GPT-3。ChatGPT 则加入了 RLHF 训练方式(相关论文 22 年 3 月发
表), 根据 ChatGPT,其每次对话平均费用在 0.01-0.2 美元,模型效果比
Instruct GPT 又提升一个台阶。我们认为新技术发展和应用将是 AIGC 工具
出现革命性迭代更为重要的驱动。
◼ 投资建议:2022 年以来 AIGC 应用多点开花,我们认为 ChatGPT 是又一个
起点,随着深度学习模型不断完善、开源模式的推动、大模型探索商业化的
可能,AIGC 有望加速发展,互联网奇异点正逐渐临近。技术相关标的,我
们推荐百度集团(已发布 AI 助理,覆盖 AI 自动生成文字等 AIGC 应用)、
微软(投资 OPENAI,人工智能领域深度布局)、 英伟达(AIGC 算力要求
提升;位于视觉生成研究领域前沿)和阿里巴巴(阿里云元宇宙加速器;
AI 视觉物料生成系统阿里鹿班);应用相关标的,我们推荐腾讯控股、
建议关注在 AI 领域有所布局的头部网文平台阅文集团和中文在线。
◼ 风险提示:行业发展不及预期、部分公司相关业务布局偏早期。
文档被以下合辑收录
评论