简介
经过大规模预训练的大模型,能够在各
种任务中达到更高的准确性、降低应用
的开发门槛、增强模型泛化能力等,是
AI 领域的一项重大进步。大模型最早的
关注度源于 NLP 领域,随着多模态能力
的演进,CV 领域及多模态通用大模型也
逐渐成为市场发展主流。政企的极大关
注带动了行业领域大模型的高速发展,
逐渐形成了多模态基模型为底座的领域
大模型和行业大模型共同发展的局面。
伴随基于大模型发展的各类应用的爆发,
尤其是生成式 AI,为用户提供突破性的
创新机会,打破了创造和艺术是人类专
属领域的局面。AI 不再仅仅是“分类”,
而且开始进行“生成”,促使大模型带
来的价值进一步升级到人类生产力工具
的颠覆式革新。同时,数据规模和参数
规模的有机提升,让大模型拥有了不断
学习和成长的基因,开始具备涌现能力
(Emergent Ability),逐渐拉开了通用人
工智能(AGI)的发展序幕。
过去几年,国内外的 AI 厂商均在大模型
领域有所布局。OpenAI 在 2019 年发布了
GPT-2 大模型,国内互联网科技厂商也
集中在 2020-2022 三年期间相继发布了自
己的大模型。ChatGPT 的发布,掀起了
一波发展热潮,原有厂商基于自身大模
型开始推出一系列生成式 AI 应用,并对
外提供 API 接口。更多的创业公司、科
研机构和新的科技厂商涌入该市场,发
布相关的产品服务。
大模型人气高涨,吸引了用户的关注,
不仅是 CIO、CTO 等技术决策人员,
CEO、CFO 等业务决策人员也同样希望
发挥此类模型在业务用例中的潜力。用
户关注度的跃升成为对厂商自身能力的
考验,前期已具备全栈大模型构建能力
的厂商开始显现积累优势。
为帮助用户了解国内大模型市场的发展
情况、厂商格局和竞争地位,沙利文研
究团队通过详实的访谈调研,对中国市
场提供大模型产品服务的厂商进行了深
入的分析和评估。
1
执行摘要
来源:CNCF,沙利文整理
全球知名大模型发布时间节点
Hugging Face:BLOOM
Google:Minerva(540B)
清华:GLM-130B
AI21 Labs:Jurassic-1-Jumbo
Stability AI:Stable Diffusion
Google:Imagen
Meta AI:OPT-175B
OpenAI:DALL-E2
DeepMind:Chinchilla
DeepMind:AlphaCode
Google:Palm(540B)
Eleuther AI:
GPT-NeoX-20B
OpenAI:InstructGPT
DeepMind:Gopher
Microsoft&NVIDIA:Megatron-Turing NLG 530B
OpenAI:Codex
百度:ERNIE-GEN(large)
智源研究院:Wu Dao 2.0
NAVER:HyperClova
清华&达摩院:CogView
AI21 Labs:Jurassic-X
Eleuther AI:
GPT-J-6B
华为:PanGu-alpha
智源研究院:Wu Dao-Wen Yuan
Eleuther AI:
GPT-Neo
OpenAI:
DALL-E
OpenAI:
GPT-3 175B(davinci)
Google:Meena
Microsoft:Turning NLG
Google:T5-3B
Google:T5-11B
Grover:Grover-Mega
NVIDIA:Megatron-LM(Original,8.3B)
OpenAI:GPT-2
百度:ERNIE 3.0
2019-Jan
2019-Apr
2019-Jul
2019-Oct
2020-Jan
2020-Apr
2020-Jul
2020-Oct
2021-Jan
2021-Apr
2021-Jul
2021-Oct
2022-Jan
2022-Apr
2022-Jul
2022-Oct
2023-Jan
United States
United Kingdom
China
India
Korea
Canada
Israel
Germany
Indeterminate
商汤:书生 1.0
2023-Apr
百度:文心一言大模型
阿里:通义千问大模型
商汤:书生 2.5
商汤:日日新大模型
阿里:通义大模型
评论