- 1、本文档共16页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
从单层感知器到深度学习以及深度学习必知的框架一 单层神经网络(感知器)1.结构下面来说明感知器模型。在原来MP模型的“输入”位置添加神经元节点,标志其为“输入单元”。其余不变,于是我们就有了下图:从本图开始,我们将权值w1, w2, w3写到“连接线”的中间。图1 单层神经网络在“感知器”中,有两个层次。分别是输入层和输出层。输入层里的“输入单元”只负责传输数据,不做计算。输出层里的“输出单元”则需要对前面一层的输入进行计算。我们把需要计算的层次称之为“计算层”,并把拥有一个计算层的网络称之为“单层神经网络”。有一些文献会按照网络拥有的层数来命名,例如把“感知器”称为两层神经网络。但在本文里,我们根据计算层的数量来命名。假如我们要预测的目标不再是一个值,而是一个向量,例如[2,3]。那么可以在输出层再增加一个“输出单元”。下图显示了带有两个输出单元的单层神经网络,其中输出单元z1的计算公式如下图。图2 单层神经网络(Z1)可以看到,z1的计算跟原先的z并没有区别。我们已知一个神经元的输出可以向多个神经元传递,因此z2的计算公式如下图。图3 单层神经网络(Z2)可以看到,z2的计算中除了三个新的权值:w4,w5,w6以外,其他与z1是一样的。整个网络的输出如下图。图4 单层神经网络(Z1和Z2)目前的表达公式有一点不让人满意的就是:w4,w5,w6是后来加的,很难表现出跟原先的w1,w2,w3的关系。因此我们改用二维的下标,用wx,y来表达一个权值。下标中的x代表后一层神经元的序号,而y代表前一层神经元的序号(序号的顺序从上到下)。例如,w1,2代表后一层的第1个神经元与前一层的第2个神经元的连接的权值(这种标记方式参照了Andrew Ng的课件)。根据以上方法标记,我们有了下图。图5 单层神经网络(扩展)如果我们仔细看输出的计算公式,会发现这两个公式就是线性代数方程组。因此可以用矩阵乘法来表达这两个公式。例如,输入的变量是[a1,a2,a3]T(代表由a1,a2,a3组成的列向量),用向量a来表示。方程的左边是[z1,z2]T,用向量z来表示。系数则是矩阵W(2行3列的矩阵,排列形式与公式中的一样)。于是,输出公式可以改写成:g(W * a) = z;这个公式就是神经网络中从前一层计算后一层的矩阵运算。2.效果与神经元模型不同,感知器中的权值是通过训练得到的。因此,根据以前的知识我们知道,感知器类似一个逻辑回归模型,可以做线性分类任务。我们可以用决策分界来形象的表达分类的效果。决策分界就是在二维的数据平面中划出一条直线,当数据的维度是3维的时候,就是划出一个平面,当数据的维度是n维时,就是划出一个n-1维的超平面。下图显示了在二维平面中划出决策分界的效果,也就是感知器的分类效果。图6 单层神经网络(决策分界)二 两层神经网络(多层感知器)1.结构两层神经网络除了包含一个输入层,一个输出层以外,还增加了一个中间层。此时,中间层和输出层都是计算层。我们扩展上节的单层神经网络,在右边新加一个层次(只含有一个节点)。现在,我们的权值矩阵增加到了两个,我们用上标来区分不同层次之间的变量。例如ax(y)代表第y层的第x个节点。z1,z2变成了a1(2),a2(2)。下图给出了a1(2),a2(2)的计算公式。图7 两层神经网络(中间层计算)计算最终输出z的方式是利用了中间层的a1(2),a2(2)和第二个权值矩阵计算得到的,如下图。图8 两层神经网络(输出层计算)假设我们的预测目标是一个向量,那么与前面类似,只需要在“输出层”再增加节点即可。我们使用向量和矩阵来表示层次中的变量。a(1),a(2),z是网络中传输的向量数据。W(1)和W(2)是网络的矩阵参数。如下图。图9 两层神经网络(向量形式)使用矩阵运算来表达整个计算公式的话如下:g(W(1) * a(1)) = a(2);g(W(2) * a(2)) = z;由此可见,使用矩阵运算来表达是很简洁的,而且也不会受到节点数增多的影响(无论有多少节点参与运算,乘法两端都只有一个变量)。因此神经网络的教程中大量使用矩阵运算来描述。需要说明的是,至今为止,我们对神经网络的结构图的讨论中都没有提到偏置节点(bias unit)。事实上,这些节点是默认存在的。它本质上是一个只含有存储功能,且存储值永远为1的单元。在神经网络的每个层次中,除了输出层以外,都会含有这样一个偏置单元。正如线性回归模型与逻辑回归模型中的一样。偏置单元与后一层的所有节点都有连接,我们设这些参数值为向量b,称之为偏置。如下图。图10 两层神经网络(考虑偏置节点)可以看出,偏置节点很好认,因为其没有输入(前一层中没有箭头指向它)。有些神经网络的结构图中会把偏置节点明显画出来,有些不会。一般情况下,我们都不会明确画出偏置节点。在
您可能关注的文档
- 什么是任务驱动型作文.ppt
- 什么是仿句?.ppt
- 什么是ERP-经典ERP介绍-V4.0.ppt
- 什么是PKI技术.ppt
- 什么叫文化?.pptx
- 什么是多囊卵巢_怎样治疗多囊卵巢.pptx
- 什么是好评语.doc
- 《两代人的对话》要素.ppt
- 什么是管理?能源管理体系运行.pptx
- 什么是感冒?2014级生物技术S1班.pptx
- 2013年中考一次函数.doc
- 2013年中考二次函数.doc
- 2013年中考特殊平行四边1.doc
- 2013年中考整式题目练习.doc
- 2014年中考整式乘除与因式分解.doc
- 消防设施检测维保人员测试题及答案.doc
- 2025年团市委领导班子、校副校长对照“四个带头”方面检视剖析材料(含反典型案例剖析)2篇文.docx
- 2025年市邮政管理局党支部书记、市行政审批和政务信息管理局领导班子对照“四个带头”方面生活会对照检视剖析材料(含反典型案例剖析)2篇文.docx
- 市委组织部常务副部长、市总工会领导班子2025年对照“四个带头”方面含违纪行为为典型案例的剖析与反思检视剖析材料{2篇文}.docx
- 局党组书记、市检察院副检察长2025年民主生活会“四个带头”对照检查材料【含典型案例剖析】2篇文.docx
最近下载
- 【课件】中国影视音乐 教学课件-高中音乐人音版(2019)必修《音乐鉴赏》.pptx
- GB_T 15566.4-2007 公共信息导向系统 设置原则与要求 第4部分 公共交通车站.pdf
- 09 全国民用建筑工程设计技术措施 结构(结构体系)(完整).doc
- 武汉市2025届高中毕业生二月调研考试(二调)数学试卷(含答案详解).pdf
- 2024年合肥滨湖时光产业投资集团本部及子公司招聘21人笔试模拟试题及答案解析.docx
- 济渎庙碑刻研讨.pdf
- 二〇二五年新年贺词.ppt VIP
- 2024版《53全优卷》2年级数学下册(北师大BSD)附参考答案.pdf VIP
- 髙磷血症病例分享.pptx VIP
- 股票如何做好盘后复盘.pdf VIP
文档评论(0)