暂无图片
暂无图片
暂无图片
暂无图片
暂无图片
苹果公司发布首份人工智能报告,AI视觉是研究新方向.pdf
295
37页
0次
2021-02-23
50墨值下载
苹果公司发布首份人工智能报告,AI 视觉是研究新方向
摘要
随着图形技术不断进步,利用合成图像训练机器学习模型变得越来越容易,这可
以帮助避免注释图像的昂贵支出。然而,通过合成图像训练机器学习模型可能无
法达到令人满意的效果,因为合成图像与真实图像之间毕竟存在区别。为了减少
这种差异,苹果公司提出“模拟+无监督”学习方法,即通过计算机生成图像或
合成图像来训练算法的图像识别能力。
事实上,这种“模拟+无监督”学习需要将无标注的真实图像数据与已经注释的
合成图像相结合。在很大程度上,它需要依赖生成式对抗网络GAN的新机器
学习技术,它可通过两个神经网络相互对抗以生成更加真实的图像。苹果公司对
标准 GAN 算法进行了多处关键性修改,以保留注释、避免伪影以及稳定性训练:
自正则化(self-regularization)-局部对抗性损失-使用精炼图像升级鉴别器。
苹果公司发现,这个过程可以产生高度逼真的图像,在质量上和用户研究方面都
已经获得证实。苹果公司已经通过训练模型评估视线水平和手势姿态,对计算机
生成图像进行定量评估。通过使用合成图像,苹果公司的图像识别算法已经取得
了巨大进步。在没有使用任何标准真实数据的情况下,苹果公司在 MPIIGaze
据集中获得了最高水平的结果。
引言
随着最近高容量深度神经学习网络的崛起,大规模标注训练数据集正变得日益重
要。可是,标准数量庞大的数据集成本非常高,而且相当耗费时间。为此,使用
合成图像而非真实图像训练算法的想法开始出现,因为注释已经可实现自动化。
利用 XBOX360 外设 Kinect 评估人体姿势以及其他任务,都是使用合成数据完
成的。
(图 1:“模拟+无监督”学习:通过计算机生成图像或合成图像来训练算法的
图像识别能力)
然而,由于合成图像与真实图像之间存在差距,使用合成图像训练算法可能产生
很多问题。因为合成图像通常不够真实,导致神经网络学习仅仅能够了解到合成
图像中的细节,并不能完整地识别出真实图像,进而也无法为算法提供精确的学
习。一种解决方案就是改进模拟器,可是增加真实性的计算往往非常昂贵,渲染
器的设计也更加困难。此外,即使最顶级的渲染器可能也无法模仿真实图像中的
所有特征。因此,缺少真实性可能导致算法过度拟合合成图像中不真实的细节。
在这篇论文中,苹果公司提出“模拟+无监督”学习的方法,其目的就是使用未
标注真实数据的模拟器提高合成图像的真实性。提高真实性可更好地帮助训练机
器学习模型,而且无需收集任何数据,也无需人类继续标注图像。除了增加真实
性,“模拟+无监督”学习还应该保留注释信息以用于训练机器学习模型,比如
图一中的注视方向应被保留下来。此外,由于机器学习模型对合成数据中的伪影
非常敏感,“模拟+无监督”学习也应该产生没有伪影的图像。
苹果公司为“模拟+无监督”学习开发出新的方法,称之为 SimGAN,它可以利
用称之为“精炼器网络refiner network的神经网络从模拟器中提炼合成图
像。图二中展示了这种方法的概述:第一,黑盒子模拟器中生成合成图像,然后
利用“精炼器网络”对其进行提炼。为了增加真实性,也就是“模拟+无监督”
of 37
50墨值下载
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文档的来源(墨天轮),文档链接,文档作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论

关注
最新上传
暂无内容,敬请期待...
下载排行榜
Top250 周榜 月榜