人工智能导论 第5章 深度学习.ppt

  1. 1、本文档共62页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
浅层学习与深度学习 现如今,深度学习已经在多种应用上取得了突破性进展。卷积神经网络是这一波深度学习浪潮的引领者。2012年AlexNet在图像识别竞赛中所带来的惊人表现,让学术界看到了深度学习所蕴含的巨大潜力。在随后的几年中,随着GoogLeNet、VGGNets、ResNets等模型的提出,CNN的识别准确率持续提高,让计算机拥有了超越人类的图像识别能力。同时,深度学习在自然语言处理方面同样取得了巨大的成功,不但有Siri这样可以与人类正常交流的对话机器人,甚至能够写诗、作曲。 浅层学习与深度学习 深度学习通过不断增加层数和神经元数量,让系统运行大量数据,并进行深度训练学习,这时神经网络就可以自己“教”自己。深度学习和传统的机器学习相比有以下三个优点。 1.高效率 传统的机器学习算法很难对原始数据进行处理,通常需要人为地从原始数据中提取特征。因此,需要系统设计者对原始的数据有相当专业的认识;在获得了比较好的特征表示后,需要设计一个对应的分类器,使用相应的特征对问题进行分类。 而深度学习是一种自动提取特征的学习算法,通过多层次的非线性变换,它可以将初始的“底层”特征表示转化为“高层”特征表示后,用“简单模型”即可完成复杂的分类学习任务。 浅层学习与深度学习 2.可塑性 在面对一个问题的时候,传统算法需要将代码重新编写一遍才能够对模型进行调整,这种改进成本巨大。而深度学习要对模型做出改变只需要调整其中的参数,不需要重新编写代码就可以达到近乎完美的程度,使一个程序具有很强的灵活性和成长性。 3.普适性 神经网络经过不断的学习自动建立算法模型来解决问题,所以几乎能够解决各种问题。 案例赏析 案例1 Alpha Go的成功秘诀 AlphaGo是一款围棋人工智能程序,由谷歌旗下DeepMind公司开发。AlphaGo的开发团队核心包括大卫·席尔瓦、黄士杰、克里斯·麦迪森、亚瑟·贵茨等人。AlphaGo围棋程序应用了近年来在人工智能领域有重大突破的深度学习和强化学习等技术,加上谷歌强大的并行计算实力,可以说其“智能”水平已经远远超过当年的“深蓝”。 案例1 AlphaGo的成功秘诀 案例1 AlphaGo的成功秘诀 简单地说一下AlphaGo的“训练”过程,AlphaGo团队首先利用几万局专业棋手对局的棋谱来训练系统,得到初步的“策略网络”和“快速走子”。 训练“策略网络”时,采用“深度学习”算法,基于全局特征和深度卷积网络来训练,其主要作用是给定当前盘面状态作为输入,输出下一步棋在棋盘其他空地上的落子概率。 “快速走子”则基于局部特征和线性模型来训练。完成这一步后,AlphaGo已经初步模拟了人类专业棋手的“棋感”。 接下来,AlphaGo采用左右互搏的模式,不同版本的AlphaGo相互之间下了3000万盘棋,利用人工智能中的“深度增强学习”算法,通过每盘棋的胜负来学习,不断优化和升级“策略网络”,同时建立了一个可以对当前局面估计黑棋和白棋胜率的“估值网络”。 案例2 AlphaGo Zero的成功秘诀 AlphaGo Zero是谷歌旗下DeepMind公司的新版程序。2016年3月,AlphaGo击败了最强的人类围棋选手之一——李世石,且AlphaGo在训练过程中使用了大量人类棋手的棋谱。2017年10月19日,DeepMind公司在《自然》杂志发布了一篇新的论文,AlphaGo Zero——它完全不依赖人类棋手的经验,经过3天的训练,AlphaGo Zero就击败了此前打败李世石的旧版AlphaGo Lee,战绩是100:0的完胜。经过40天的自我训练,AlphaGo Zero又以压倒性的89:11比分打败了AlphaGo Master(AlphaGo Master曾于网络上对战人类世界顶尖棋手,创造了60连胜的记录) 案例2 AlphaGo Zero的成功秘诀 最重要的突破在于,它不仅可以解决围棋问题,还可以在不需要知识预设的情况下,解决一切棋类问题。经过几个小时的训练,它又击败了最强国际象棋冠军程序Stockfish。 DeepMind利用了深度学习技术,结合了更多经典的强化学习方法来实现必威体育精装版的突破。AlphaGo Zero是DeepMind的自动操作系统的必威体育精装版化身。 AlphaGo Zero击败AlphaGo Master的棋谱。 谢 谢 ! * * * * 5.2.2 BP网络算法 拓展阅读 延恩·乐存 1988年开始,乐存在著名的贝尔实验室工作了20年。乐存目前是纽约大学终身教授,同时是Facebook的人工智能实验室负责人。乐存曾经跟随辛顿教授作过博士后研究,他对人工智能领域的最核心贡献是发展和推广了卷积神经网络(CNN),1998年,乐

文档评论(0)

dllkxy + 关注
实名认证
内容提供者

本文库主要涉及建筑、教育等资料,有问题可以联系解决哦

版权声明书
用户编号:5213302032000001

1亿VIP精品文档

相关文档