
导读 随着 ChatGPT 的热潮,小布助手也借鉴其思想,在 AIGC 方面进行了一些探索。本文将分享小布在 AIGC 画图上的进展和 AIGC 的 OPEN 问题。希望通过本次分享,为读者带来一些经验和灵感。
1. AIGC 定义及其种类
2. 小布在 AIGC 画图上的进展
3. AIGC 的 OPEN 问题
分享嘉宾|郑志彤(Liam) OPPO 数智系统多模态学习负责人
编辑整理|华永奎
内容校对|李瑶
出品社区|DataFun
01
1. AIGC 的定义
2. AIGC 的关键指标
Performance(性能):FID(图片感知距离)、Perplexity(困惑度)、FOV(视频感知距离),Diffusion model=GAN>VAE。 Diversity(多样性):生成样本的分布差异距离的方差,diffusionmodel=VAE>GAN。 Novelty(新颖性):生成样本和训练集数据最小分布距离最大化。
3. AIGC 的种类-GFlowNet

4. AIGC 的种类-扩散模型

5. AIGC 的种类-生成式对抗网络

6. AIGC 的种类-变分自编码

7. AIGC 的种类-能量模型

8. AIGC 的种类-自回归模型

9. AIGC 的种类-标准化流

02
小布在 AIGC 画图上的进展
1. AIGC 画图上线的各种场景展示

2. AIGC 画图的技术创新点



AIGC 的 OPEN 问题
1. GPT4 令人振奋的自测结果

2. Yann LeCun 的观点

3. 三方的测评

4. 我的观点



缺少归纳和演绎的联结主义实现,即缺少数据模型到理论模型的升华,也是当前机器学习模型存在 OOD 泛化问题的本质原因。 除语言智商和视觉空间智商外,其它六个智商都没有较好的人工神经网络表征和训练方法出来。 目前基于 transformer 的 AR-LLM,仅仅学习了语言的语法信息和浅层语义信息,需要和数理逻辑智商的优秀 AI 实现结合起来。

分享嘉宾
INTRODUCTION

郑志彤(Liam)

OPPO

数智系统多模态学习负责人

OPPO 高级算法架构师,现任数智系统机器学习 TMG 主任、小布智能中心多模态学习负责人,促进小布从语音助手进化成多模态助手,打造 AndesGPT 多模态能力,落地了多个小布 AIGC 场景,有小布绘画、锁屏壁纸生成、小布空间图片生成等。2020 年 8 月加入 OPPO,参加商业算法软件商店首页攻坚,贡献了千6AUC 提升和 2 点多 ARPU 值提升;随后调入数智系统机器学习部,负责了端云协同的 StarFire 项目;之后又调入小布智能中心,负责多模态学习,短时间搭建了虚拟人算法团队和 StarLite 项目团队,启动了多模态预训练和 AIGC 项目。在机器学习领域有十几年经验,对 CV、NLP、音频、推荐系统等算法有深刻认知,对 AI 工程化有实操经验,十分关注通用智能的发展,多模态技术是通用智能的关键一环。硕士毕业于清华大学,本科毕业于人民大学。
往期推荐
复杂图上的知识迁移学习
开源delta lake 3.0 优势和发展
多模态大模型在文本和视频分析中的应用
流式数据湖 Paimon 0.7 的研发进展
多模内容理解在百度商业广告中的探索实践
直播预告| 智能运维,如何让中小企业数据库管理更高效?
哔哩哔哩基于 Iceberg 的智能数据组织优化实践
图技术在金融反欺诈中的应用
CloudCamel:OPPO 云上大数据极致优化之路

点个在看你最好看
SPRING HAS ARRIVED





