- 1、本文档共6页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
研讨课课程的报告
课 程 报 告
课程:计算机科学进展
课程号: 0830EY01
所在学院 计算机学院
学 号
姓 名
任课教师
成绩: __________________
2015-2016春季学期
如何看待AlphaGo
姓名: 学号:
摘要:
韩国棋手李世石和谷歌AlphaGo大战围棋五回合持续了一周,最终在北京时间3月15号拉下帷幕。随着最后一战李世石投子认输,这场人机大战最终以李世石1:4落败。早在比赛前AlphaGo并不被人们看好,但AlphaGo除第四场战败以外,其他四场几乎是很轻松完败李世石。回顾这场人机大战,AlphaGo表现出超强实力。那么,AlphaGo是什么?又是为何会如此强大?AlphaGo
1.1 什么是AlphaGo
阿尔法围棋(AlphaGo)是一款围棋人工智能程序,由位于英国伦敦的谷歌(Google)旗下DeepMind公司的戴维·西尔弗、艾佳·黄和戴密斯·哈萨比斯与他们的团队开发,这个程序利用“价值网络”去计算局面,用“策略网络”去选择下子。2015年10月阿尔法围棋以5:0完胜欧洲围棋冠军、职业二段选手樊麾;2016年3月对战世界围棋冠军、职业九段选手李世石,并以4:1的总比分获胜。
介绍AlphaGo,就必须说下AlphaGo的四个系统组成【1】:AlphaGo下棋的原理是什么【2】AlphaGo一定蕴藏高深的科技,那么AlphaGo的“撒手锏”又是什么?
阿尔法围棋是通过两个不同神经网络“大脑”合作来改进下棋。这些大脑是多层神经网络跟那些Google图片有哪些信誉好的足球投注网站引擎识别图片在结构上是相似的。它们从多层启发式二维过滤器开始,去处理围棋棋盘的定位,就像图片分类器网络处理图片一样。经过过滤,13个完全连接的神经网络层产生对它们看到的局面判断。这些层能够做分类和逻辑推理。这些网络通过反复训练来检查结果,再去校对调整参数,去让下次执行更好。这个处理器有大量的随机性元素,所以人们是不可能精确知道网络是如何“思考”的,但更多的训练后能让它进化到更好。
第一大脑:落子选择器。团队通过在KGS(网络围棋对战平台)上最强人类对手,百万级的对弈落子去训练大脑。这就是AlphaGo最像人的地方,目标是去学习那些顶尖高手的妙手。这个不是为了去下赢,而是去找一个跟人类高手同样的下一步落子。AlphaGo落子选择器能正确符合57%的人类高手。
。局面评估器也通过百万级别的棋局做训练。Silver团队通过 复制两个AlphaGo的最强落子选择器,精心挑选随机样本创造了这些局面。这里AI 落子选择器在高效创建大规模数据集去训练局面评估器是非常有价值的。这种落子选择器让大家去模拟继续往下走的很多可能,从任意给定棋盘局面去猜测大致的双方赢棋概率,而人类的棋局还不够多恐怕难以完成这种训练。
AlphaGo会有哪些新进展
(3)AlphaGo有什么缺陷AlphaGo如此强大,但是既然能在第四局被李世石打败,说明AlphaGo还是有一些缺陷的。提起缺陷,我们从以下几点探讨:
2.1 AlphaGo与李世石对决情况
前三局AlphaGo完败李世石,都是在李世石出现失误的情况之下,被AlphaGo牢牢捕捉到,并且趁势紧逼,不给李世石喘气的机会,第五局也是如此。而在第四局李世石并没有表现出明显的可以被机器识别的失误,也就没有给AlphaGo找到突破点的机会。
2.2 算法本身的缺陷【5】
AlphaGo使用深度学习加蒙特卡洛树,
2.3 程序自身的缺陷
虽然AlphaGo使用深度学习加蒙特卡洛树等高级算法,但是这些是人写的代码,就会有内在的缺陷,不太可能是完美无缺的。这些缺陷不是“流水线”不眠不休疯狂训练能解决的,是AlphaGo真正的内在缺陷,是深度学习、self-play、进化、强化学习这些高级名词解决不了的。谷歌再能堆硬件,也解决不了,还得人去改代码【6】。
1.在可以凭逻辑分析推算的问题上,机器即将远远把人类抛在后面。机器速度会越来越快,学习能力会越来越强,数据会越来越多。
2.在大数据+机器学习+大规模并行计算的时代,我们将看到无数的商机和产品,能够在预测、分析、推荐等方面,产生巨大的商业和用户价值。不过,这些解决方案和人类相比,其实没有什么意义,因为人差太远了。
3.在感知方面,人类也将会被机器超越。今天的语音识别,人脸识别,未来的自动驾驶,都是例子。
4.但是,以上都还是冷冰冰的技术,机器是否会人性化还是未知的。毕竟,在情感方面,机器甚至连基础都没有。对人工智能的研究者,这是下一个挑战。
对于
其次,AlphaGo的背后是基于对数以百万计棋局的学习和足够多的训练,它的强大之处在于其自我学习能力,这区别于通
文档评论(0)