2023年中国AI大模型行业白皮书.pdf

手机用户9600

889

4页

2次

2023-06-15

100墨值下载

AI 大模型市场研究报告（2023）——

迈向通用人工智能，大模型拉开新时代序幕

简介

经过大规模预训练的大模型，能够在各

种任务中达到更高的准确性、降低应用

的开发门槛、增强模型泛化能力等，是

AI 领域的一项重大进步。大模型最早的

关注度源于 NLP 领域，随着多模态能力

的演进，CV 领域及多模态通用大模型也

逐渐成为市场发展主流。政企的极大关

注带动了行业领域大模型的高速发展，

逐渐形成了多模态基模型为底座的领域

大模型和行业大模型共同发展的局面。

伴随基于大模型发展的各类应用的爆发，

尤其是生成式 AI，为用户提供突破性的

创新机会，打破了创造和艺术是人类专

属领域的局面。AI 不再仅仅是“分类”，

而且开始进行“生成”，促使大模型带

来的价值进一步升级到人类生产力工具

的颠覆式革新。同时，数据规模和参数

规模的有机提升，让大模型拥有了不断

学习和成长的基因，开始具备涌现能力

（Emergent Ability），逐渐拉开了通用人

工智能（AGI）的发展序幕。

过去几年，国内外的 AI 厂商均在大模型

领域有所布局。OpenAI 在 2019 年发布了

GPT-2 大模型，国内互联网科技厂商也

集中在 2020-2022 三年期间相继发布了自

己的大模型。ChatGPT 的发布，掀起了

一波发展热潮，原有厂商基于自身大模

型开始推出一系列生成式 AI 应用，并对

外提供 API 接口。更多的创业公司、科

研机构和新的科技厂商涌入该市场，发

布相关的产品服务。

大模型人气高涨，吸引了用户的关注，

不仅是 CIO、CTO 等技术决策人员，

CEO、CFO 等业务决策人员也同样希望

发挥此类模型在业务用例中的潜力。用

户关注度的跃升成为对厂商自身能力的

考验，前期已具备全栈大模型构建能力

的厂商开始显现积累优势。

为帮助用户了解国内大模型市场的发展

情况、厂商格局和竞争地位，沙利文研

究团队通过详实的访谈调研，对中国市

场提供大模型产品服务的厂商进行了深

入的分析和评估。

执行摘要

来源：CNCF，沙利文整理

全球知名大模型发布时间节点

Hugging Face：BLOOM

Google：Minerva(540B)

清华：GLM-130B

AI21 Labs:Jurassic-1-Jumbo

Stability AI:Stable Diffusion

Google：Imagen

Meta AI：OPT-175B

OpenAI：DALL-E2

DeepMind:Chinchilla

DeepMind:AlphaCode

Google：Palm(540B)

Eleuther AI：

GPT-NeoX-20B

OpenAI：InstructGPT

DeepMind:Gopher

Microsoft&NVIDIA:Megatron-Turing NLG 530B

OpenAI：Codex

百度：ERNIE-GEN(large)

智源研究院：Wu Dao 2.0

NAVER：HyperClova

清华&达摩院：CogView

AI21 Labs:Jurassic-X

Eleuther AI：

GPT-J-6B

华为：PanGu-alpha

智源研究院：Wu Dao-Wen Yuan

Eleuther AI：

GPT-Neo

OpenAI：

DALL-E

OpenAI:

GPT-3 175B(davinci)

Google：Meena

Microsoft:Turning NLG

Google：T5-3B

Google：T5-11B

Grover：Grover-Mega

NVIDIA：Megatron-LM(Original，8.3B)

OpenAI：GPT-2

百度：ERNIE 3.0

2019-Jan

2019-Apr

2019-Jul

2019-Oct

2020-Jan

2020-Apr

2020-Jul

2020-Oct

2021-Jan

2021-Apr

2021-Jul

2021-Oct

2022-Jan

2022-Apr

2022-Jul

2022-Oct

2023-Jan

United States

United Kingdom

China

India

Korea

Canada

Israel

Germany

Indeterminate

商汤：书生 1.0

2023-Apr

百度：文心一言大模型

阿里：通义千问大模型

商汤：书生 2.5

商汤：日日新大模型

阿里：通义大模型

简介

经过大规模预训练的大模型，能够在各

种任务中达到更高的准确性、降低应用

的开发门槛、增强模型泛化能力等，是

AI 领域的一项重大进步。大模型最早的

关注度源于 NLP 领域，随着多模态能力

的演进，CV 领域及多模态通用大模型也

逐渐成为市场发展主流。政企的极大关

注带动了行业领域大模型的高速发展，

逐渐形成了多模态基模型为底座的领域

大模型和行业大模型共同发展的局面。

伴随基于大模型发展的各类应用的爆发，

尤其是生成式 AI，为用户提供突破性的

创新机会，打破了创造和艺术是人类专

属领域的局面。AI 不再仅仅是“分类”，

而且开始进行“生成”，促使大模型带

来的价值进一步升级到人类生产力工具

的颠覆式革新。同时，数据规模和参数

规模的有机提升，让大模型拥有了不断

学习和成长的基因，开始具备涌现能力

（Emergent Ability），逐渐拉开了通用人

工智能（AGI）的发展序幕。

过去几年，国内外的 AI 厂商均在大模型

领域有所布局。OpenAI 在 2019 年发布了

GPT-2 大模型，国内互联网科技厂商也

集中在 2020-2022 三年期间相继发布了自

己的大模型。ChatGPT 的发布，掀起了

一波发展热潮，原有厂商基于自身大模

型开始推出一系列生成式 AI 应用，并对

外提供 API 接口。更多的创业公司、科

研机构和新的科技厂商涌入该市场，发

布相关的产品服务。

大模型人气高涨，吸引了用户的关注，

不仅是 CIO、CTO 等技术决策人员，

CEO、CFO 等业务决策人员也同样希望

发挥此类模型在业务用例中的潜力。用

户关注度的跃升成为对厂商自身能力的

考验，前期已具备全栈大模型构建能力

的厂商开始显现积累优势。

为帮助用户了解国内大模型市场的发展

情况、厂商格局和竞争地位，沙利文研

究团队通过详实的访谈调研，对中国市

场提供大模型产品服务的厂商进行了深

入的分析和评估。

执行摘要

来源：CNCF，沙利文整理

全球知名大模型发布时间节点

Hugging Face：BLOOM

Google：Minerva(540B)

清华：GLM-130B

AI21 Labs:Jurassic-1-Jumbo

Stability AI:Stable Diffusion

Google：Imagen

Meta AI：OPT-175B

OpenAI：DALL-E2

DeepMind:Chinchilla

DeepMind:AlphaCode

Google：Palm(540B)

Eleuther AI：

GPT-NeoX-20B

OpenAI：InstructGPT

DeepMind:Gopher

Microsoft&NVIDIA:Megatron-Turing NLG 530B

OpenAI：Codex

百度：ERNIE-GEN(large)

智源研究院：Wu Dao 2.0

NAVER：HyperClova

清华&达摩院：CogView

AI21 Labs:Jurassic-X

Eleuther AI：

GPT-J-6B

华为：PanGu-alpha

智源研究院：Wu Dao-Wen Yuan

Eleuther AI：

GPT-Neo

OpenAI：

DALL-E

OpenAI:

GPT-3 175B(davinci)

Google：Meena

Microsoft:Turning NLG

Google：T5-3B

Google：T5-11B

Grover：Grover-Mega

NVIDIA：Megatron-LM(Original，8.3B)

OpenAI：GPT-2

百度：ERNIE 3.0

2019-Jan

2019-Apr

2019-Jul

2019-Oct

2020-Jan

2020-Apr

2020-Jul

2020-Oct

2021-Jan

2021-Apr

2021-Jul

2021-Oct

2022-Jan

2022-Apr

2022-Jul

2022-Oct

2023-Jan

United States

United Kingdom

China

India

Korea

Canada

Israel

Germany

Indeterminate

商汤：书生 1.0

2023-Apr

百度：文心一言大模型

阿里：通义千问大模型

商汤：书生 2.5

商汤：日日新大模型

阿里：通义大模型

of 4

100墨值下载

白皮书

关注

评论