斯坦福ML公开课笔记5.pdf

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
斯坦福ML公开课笔记5

/yanxiangzhang /stdcoutzyx 斯坦福ML 公开课笔记5 这篇笔记针对的是公开课视频的第五个,主要内容包括生成学习算法 (generate learning algorithm )、高斯判别分析(Gaussian Discriminant Analysis , GDA )、朴素贝叶斯(Navie Bayes )、拉普拉斯平滑(Laplace Smoothing )。 生成学习算法 之前的视频中讲到的方法都是直接对问题进行求解,比如二类分类问题,不 管是感知器算法还是逻辑斯蒂回归算法,都是在解空间中寻找一条直线从而把两 种类别的样例分开,对于新的样例只要判断在直线的哪一侧即可;这种直接对问 题求解的方法可以成为判别学习方法(discriminative learning algorithm )。而生成 学习算法则是对两个类别分别进行建模,用新的样例去匹配两个模型,匹配度较 高的作为新样例的类别,比如良性肿瘤与恶性肿瘤的分类,首先对两个类别分别 建模,比如分别计算两类肿瘤是否扩散的概率,计算肿瘤大小大于某个值的概率 等等;再比如狗与大象的分类,分别对狗与大象建模,比如计算体重大于某个值 的概率,鼻子长度大于某个值的概率等等。 形式化的说,判别学习方法是直接对p(y|x)进行建模或者直接学习输入空间 到输出空间的映射关系,其中,x 是某类样例的特征,y 是某类样例的分类标记。 而生成学习方法是对p(x|y) (条件概率)和p(y) (先验概率)进行建模,然后按 照贝叶斯法则求出后验概率p(y|x) : (|)() ( | ) p y x = (1) () 使得后验概率最大的类别y 即是新样例的预测值: (|)() ( | ) argmax = argmax =argmax(|)() (2) () 高斯判别分析 高斯判别分析(GDA )就是一种生成学习算法,不过比较奇怪的是它的名 字里居然有判别两个字,可能会让人误以为它是判别学习方法,不过它却是地地 道道的生成学习算法。 在 GDA 中,假设p(x|y)属于多变量正态分布。多变量正态分布是正态分布 在多维变量下的扩展,它的参数是一个均值向量 (mean vector )μ和协方差矩阵 ∑ ∗ ∑ ∗ (covariance matrix ) ∈ ,其中n 是多维变量的向量长度, ∈ 是对称 /yanxiangzhang /stdcoutzyx 正定矩阵。多变量正态分布的概率密度函数为: 1 1 ( ) ( ) −1 p x;μ,Σ = /2 1/2 exp⁡(− − Σ ( −)) (3) (2) |Σ| 2 其中,|Σ|是行列式的值。 对于服从多变量正态分布的随机变量x ,均值由下面的公式得到: , - ( )

文档评论(0)

xxj1658888 + 关注
实名认证
内容提供者

教师资格证持证人

该用户很懒,什么也没介绍

领域认证该用户于2024年04月12日上传了教师资格证

1亿VIP精品文档

相关文档