斯坦福ML公开课笔记5.pdf

下载文档

10
0
约1.52万字
约 6页
2017-05-25 发布于河南
举报
版权申诉
保障服务

斯坦福ML公开课笔记5.pdf

1、本文档共6页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

斯坦福ML公开课笔记5

/yanxiangzhang /stdcoutzyx 斯坦福ML 公开课笔记5 这篇笔记针对的是公开课视频的第五个，主要内容包括生成学习算法（generate learning algorithm ）、高斯判别分析（Gaussian Discriminant Analysis ， GDA ）、朴素贝叶斯（Navie Bayes ）、拉普拉斯平滑（Laplace Smoothing ）。生成学习算法之前的视频中讲到的方法都是直接对问题进行求解，比如二类分类问题，不管是感知器算法还是逻辑斯蒂回归算法，都是在解空间中寻找一条直线从而把两种类别的样例分开，对于新的样例只要判断在直线的哪一侧即可；这种直接对问题求解的方法可以成为判别学习方法（discriminative learning algorithm ）。而生成学习算法则是对两个类别分别进行建模，用新的样例去匹配两个模型，匹配度较高的作为新样例的类别，比如良性肿瘤与恶性肿瘤的分类，首先对两个类别分别建模，比如分别计算两类肿瘤是否扩散的概率，计算肿瘤大小大于某个值的概率等等；再比如狗与大象的分类，分别对狗与大象建模，比如计算体重大于某个值的概率，鼻子长度大于某个值的概率等等。形式化的说，判别学习方法是直接对p(y|x)进行建模或者直接学习输入空间到输出空间的映射关系，其中，x 是某类样例的特征，y 是某类样例的分类标记。而生成学习方法是对p(x|y) （条件概率）和p(y) （先验概率）进行建模，然后按照贝叶斯法则求出后验概率p(y|x) ： (|)() ( | ) p y x = (1) () 使得后验概率最大的类别y 即是新样例的预测值： (|)() ( | ) argmax = argmax =argmax(|)() (2) () 高斯判别分析高斯判别分析（GDA ）就是一种生成学习算法，不过比较奇怪的是它的名字里居然有判别两个字，可能会让人误以为它是判别学习方法，不过它却是地地道道的生成学习算法。在 GDA 中，假设p(x|y)属于多变量正态分布。多变量正态分布是正态分布在多维变量下的扩展，它的参数是一个均值向量（mean vector ）μ和协方差矩阵 ∑ ∗ ∑ ∗ （covariance matrix ） ∈ ,其中n 是多维变量的向量长度， ∈ 是对称 /yanxiangzhang /stdcoutzyx 正定矩阵。多变量正态分布的概率密度函数为： 1 1 ( ) ( ) −1 p x;μ,Σ = /2 1/2 exp⁡(− − Σ ( −)) (3) (2) |Σ| 2 其中，|Σ|是行列式的值。对于服从多变量正态分布的随机变量x ，均值由下面的公式得到： , - ( )

您可能关注的文档

文档评论（0）

xxj1658888 + 关注: 实名认证

内容提供者

教师资格证持证人

该用户很懒，什么也没介绍

咨询Ta 进入空间

领域认证该用户于2024年04月12日上传了教师资格证

1亿VIP精品文档

更多 >

斯坦福ML公开课笔记5.pdf