- 1、本文档共26页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
DeepLearning
实际工作中的一些高级技术
Johnson
导师:
主要内容
1.训练加速
2.推理加速
3.深度学习自适应
4.对抗神经网络
训练加速
工作中最常用为多GPU训练:
1.基于数据的并行(常用)
2.基于模型的并行
基于数据的并行
Server
ModelAverage(模型平均)
……
Client1Client2Clientn
基于数据的并行
SSGD(同步随机梯度下降)Server
……
Client1Client2Clientn
基于数据的并行
ASGD(异步随机梯度下降)Server
……
Client1Client2Clientn
基于模型的并行
推理加速
1.SVD分解
2.HiddenNodeprune
3.知识蒸馏(teacherstudent)
4.参数共享(lstm的参数共享)
5.神经网络的量化
6.BinaryNet
7.基于fft的循环矩阵加速
SVD分解
1.Pretrain
2.svd+finetuning
HiddenNodeprune
1.Pretrain
2.HiddenNodeprune+finetuning
知识蒸馏(teacherstudent)
KL距离(相对熵)
KL距离,是Kullback-Leibler差异(Kullback-LeiblerDivergence)的简称,也叫作相对熵
(RelativeEntropy)。它衡量的是相同事件空间里的两个概率分布的差异情况。其物理意义是:在相
同事件空间里,概率分布P(x)对应的每个事件,若用概率分布Q(x)编码时,平均每个基本事件
(符号)编码长度增加了多少比特。我们用(P||Q)表示KL距离,计算公式如下:
(|=()log()
()
当两个概率分布完全相同时,即P(X)=Q(X),其相对熵为0。
我们知道,概率分布P(X)的信息熵为:
知识蒸馏(teacherstudent)
−1
=−log
您可能关注的文档
- 第二周和第三周:机器学习基础.pdf
- 第六周:第九章卷积网络(更新).pdf
- 第六周:第九章卷积网络2.0.pdf
- 第七、八周:第十章循环神经网络.pdf
- 第四周:深度前馈网络.pdf
- 第五周深度模型的优化.pdf
- 第一周:数学基础(修正版).pdf
- 生物中考专题复习生物与环境.ppt
- Shoro公司饮料品牌市场拓展策略与营销创新研究.docx
- 2025海南省五指山市北师大版7年级数学上册期中全真模拟模拟题及一套完整答案详解.docx
- 2025海南省万宁市中考物理必背100题【考点提分】附答案详解.docx
- 2025浙江省温岭市中考物理能力检测试卷附参考答案详解(培优A卷).docx
- 2025年班风学风教育主题班会.pptx
- 2025浙江省温岭市北师大版7年级数学上册期中每日一练试卷附答案详解.docx
- 解剖呼吸系统课件.pptx
- 2025浙江省瑞安市中考物理考点攻克及答案详解【网校专用】.docx
- 2025浙江省温岭市中考物理考试综合练习附完整答案详解【各地真题】.docx
- 光伏发电系统功率预测技术综述:方法论与发展前景.docx
- 2025浙江省温岭市中考物理经典例题及答案详解【夺冠】.docx
- 客户集中度与成本结构优化决策研究.docx
文档评论(0)