苹果公司发布首份人工智能报告,AI 视觉是研究新方向.pdfVIP

苹果公司发布首份人工智能报告,AI 视觉是研究新方向.pdf

  1. 1、本文档共37页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
苹果公司发布首份人工智能报告,AI 视觉是研究新方向 摘要 随着图形技术不断进步,利用合成图像训练机器学习模型变得越来越容易,这可 以帮助避免注释图像的昂贵支出。然而,通过合成图像训练机器学习模型可能无 法达到令人满意的效果,因为合成图像与真实图像之间毕竟存在区别。为了减少 这种差异,苹果公司提出“模拟+无监督”学习方法,即通过计算机生成图像或 合成图像来训练算法的图像识别能力。 事实上,这种“模拟+无监督”学习需要将无标注的真实图像数据与已经注释的 合成图像相结合。在很大程度上,它需要依赖生成式对抗网络(GAN )的新机器 学习技术,它可通过两个神经网络相互对抗以生成更加真实的图像。苹果公司对 标准 GAN 算法进行了多处关键性修改,以保留注释、避免伪影以及稳定性训练: 自正则化(self-regularization)-局部对抗性损失-使用精炼图像升级鉴别器。 苹果公司发现,这个过程可以产生高度逼真的图像,在质量上和用户研究方面都 已经获得证实。苹果公司已经通过训练模型评估视线水平和手势姿态,对计算机 生成图像进行定量评估。通过使用合成图像,苹果公司的图像识别算法已经取得 了巨大进步。在没有使用任何标准真实数据的情况下,苹果公司在 MPIIGaze 数 据集中获得了最高水平的结果。 引言 随着最近高容量深度神经学习网络的崛起,大规模标注训练数据集正变得日益重 要。可是,标准数量庞大的数据集成本非常高,而且相当耗费时间。为此,使用 合成图像而非真实图像训练算法的想法开始出现,因为注释已经可实现自动化。 利用 XBOX360 外设 Kinect 评估人体姿势以及其他任务,都是使用合成数据完 成的。 (图1 :“模拟+无监督”学习:通过计算机生成图像或合成图像来训练算法的 图像识别能力 ) 然而,由于合成图像与真实图像之间存在差距,使用合成图像训练算法可能产生 很多问题。因为合成图像通常不够真实,导致神经网络学习仅仅能够了解到合成 图像中的细节,并不能完整地识别出真实图像,进而也无法为算法提供精确的学 习。一种解决方案就是改进模拟器,可是增加真实性的计算往往非常昂贵,渲染 器的设计也更加困难。此外,即使最顶级的渲染器可能也无法模仿真实图像中的 所有特征。因此,缺少真实性可能导致算法过度拟合合成图像中不真实的细节。 在这篇论文中,苹果公司提出“模拟 +无监督”学习的方法,其目的就是使用未 标注真实数据的模拟器提高合成图像的真实性。提高真实性可更好地帮助训练机 器学习模型,而且无需收集任何数据,也无需人类继续标注图像。除了增加真实 性,“模拟 +无监督”学习还应该保留注释信息以用于训练机器学习模型,比如 图一中的注视方向应被保留下来。此外,由于机器学习模型对合成数据中的伪影 非常敏感,“模拟 +无监督”学习也应该产生没有伪影的图像。 苹果公司为“模拟 +无监督”学习开发出新的方法,称之为 SimGAN ,它可以利 用称之为“精炼器网络(refiner network )”的神经网络从模拟器中提炼合成图 像。图二中展示了这种方法的概述:第一,黑盒子模拟器中生成合成图像,然后 利用“精炼器网络”对其进行提炼。为了增加真实性,也就是“模拟 +无监督” 学习算法的首要需求,我们需要利用类似生成式对抗网络(GAN)来训练“精炼器 网络”,进而产生判别网络无法区分真假的精炼图像。 第二,为了保留合成图像上的注释信息,苹果公司需要利用“自正则化损失”弥 补对抗性损失,在合成图像和精炼图像之间进行修改。此外,我们还利用完全卷 积神经网络,在像素水平方面进行操作,并保留全局结构,而非整体修改图像的 内容。 第三,GAN 框架要求训练 2 个神经网络进行对抗,它们的目标往往不够稳定, 倾向于产生伪影。为了避免漂移和产生更强的伪影,导致甄别更困难,我们需要 限定鉴别器的接收区域为局部接收,而非整张图片接收,这导致每张图像都会产 生多个局部对抗性损失。此外,苹果公司还引入提高训练稳定性的方法,即通过 使用精炼图像而非当前“精炼器网络”中的现有图像升级鉴别器。 1.1 相关工作 GAN 框架需要 2 个神经网络竞争损失,即生成器与鉴别器。其中,生成器网络 的目标是在真实图像上绘制随机向量,而鉴别器网络的目标则是区分生成图像与 真实图像。GAN 网络是由古德弗罗(I. Goodfellow )等人首先引入的,它

文档评论(0)

535600147 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:6010104234000003

1亿VIP精品文档

相关文档