从sgd到adam深度学习优化算法概览(一).docx

从sgd到adam深度学习优化算法概览(一).docx

  1. 1、本文档共5页,其中可免费阅读3页,需付费100金币后方可阅读剩余内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,可选择认领,认领后既往收益都归您。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细先通过免费阅读内容等途径辨别内容交易风险。如存在严重挂羊头卖狗肉之情形,可联系本站下载客服投诉处理。
  4. 4、文档侵权举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
从 SGD 到 Adam 深度学习优化算法概览 (一) 楔子前些日在写计算数学课的期末读书报告,我选择的主题是「分析深度学习中的各个优化算法」 。在此前的工作 中,自己通常就是无脑「 Adam 大法好」,而对算法本身的 内 涵不知所以然。一直希望能抽时间系统的过一遍优化算法 的发展历程,直观了解各个算法的长处和短处。这次正好借 着作业的机会,补一补课。本文主要借鉴了 @Juliuszh 的 文章 [1] 思路,使用一个 general 的框架来描述各个梯度下降 变种算法。实际上,本文可以视作对 [1] 的重述,在此基础上, 对原文描述不够详尽的部分做了一定补充,并修正了其中许 多错误的表述和公

文档评论(0)

180****7385 + 关注
官方认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:8040052114000031
认证主体苏州市山高水长互联网科技有限公司
IP属地江苏
统一社会信用代码/组织机构代码
91320582MA7GX8A69F

1亿VIP精品文档

相关文档