第一章 统计学习方法概论.pdfVIP

  1. 1、本文档共32页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第一章 统计学习方法概论

袁春 清华大学深圳研究生院 李航 华为诺亚方舟实验室 目录 1. 统计学习 2. 监督学习 3. 统计学习三要素 4. 模型评估与模型选择 5. 正则化与交叉验证 6. 泛化能力 7. 生成模型与判别模型 8. 分类问题 9. 标注问题 10. 回归问题 一、统计学习 统计学习的对象 data :计算机及互联网上的各种数字、文字、图像、视 频、音频数据以及它们的组合。 数据的基本假设是同类数据具有一定的统计规律性。 统计学习的目的 用于对数据 (特别是未知数据)进行预测和分析。 统计学习 统计学习的方法 分类:  Supervised learning  Unsupervised learning  Semi-supervised learning  Reinforcement learning 监督学习:  训练数据 training data  模型 model 假设空间 hypothesis  评价准则 evaluation criterion 策略 strategy  算法 algorithm 统计学习 统计学习的研究:  统计学习方法  统计学习理论 (统计学习方法的有效性和效率和基本理论)  统计学习应用 二、监督学习 Instance ,feature vector ,feature space 输入实例x 的特征向量:  x(i)与x 不同,后者表示多个输入变量中的第i个 i 训练集: 输入变量和输出变量: 分类问题、回归问题、标注问题 监督学习 联合概率分布 假设输入与输出的随机变量X和Y遵循联合概率分布P(X,Y) P(X,Y)为分布函数或分布密度函数 对于学习系统来说,联合概率分布是未知的, 训练数据和测试数据被看作是依联合概率分布P(X,Y)独立 同分布产生的。 假设空间 监督学习目的是学习一个由输入到输出的映射,称为模型 模式的集合就是假设空间 (hypothesis space ) 概率模型:条件概率分布P(Y |X), 决策函数:Y=f(X) 监督学习 问题的形式化 三、统计学习三要素 模型: 决策函数的集合: 参数空间 条件概率的集合: 参数空间 统计学习三要素 策略 损失函数:一次预测的好坏 风险函数:平均意义下模型预测的好坏 0-1损失函数 0-1 loss function 平方损失函数 quadratic loss function 绝对损失函数 absolute loss function 统计学习三要素 策略 对数损失函数 logarithmic loss function 或对数似然损失 函数 loglikelihood loss function 损失函数的期望 风险函数 risk function 期望损失 expected loss 由P(x,y)可以直接求出P(x |y),但不知道, 经验风险 empirical risk ,经验损失 empirical loss 统计学习三要素 策略:经验风险最小化与结构风险最小化 经验风险最小化最优模型 当样本容量很小时,经验风险最小化学习的效果未必很 好,会产生 “过拟合over-fitting ” 结构风险最小化 structure risk minimization ,为防止过 拟合提出的策略,等价于正则化 (regularization ),加 入正则化项regularizer ,或罚项 penalty term : 统计学习三要素 求最优模型就是求解最优化问题: 统计学

文档评论(0)

celkhn5460 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档