统计学习基础.ppt

  1. 1、本文档共17页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
统计学习基础

统计学习基础 卿来云 中国科学院研究生院信息学院 lyqing@ / lyqing@ 概率 vs. 统计 概率:研究随机事件出现的可能性的数学分支,描述非确定性(Uncertainty)的正式语言,是统计推断的基础 概率: 一个事件或事件集合出现的可能性 基本问题:给定以一个数据产生过程,则输出的性质是什么 统计推断:处理数据分析和概率理论的数学分支,与数据挖掘和机器学习是近亲 统计量:一个用以描述样本或总体性质的数值,如均值或方差 基本问题:给定输出数据,我们可以得到该数据的产生过程的哪些信息 概率 vs. 统计 统计学习 统计学 ≈ 根据数据进行推理的学科 统计学习 ≈多元统计分析 + 计算统计学 多元统计分析 ≈ 基于一个多元变量数据集,预测函数值 计算统计学 ≈ 统计问题的计算方法 (a.k.a. 统计计算) + 计算繁重的统计方法 数据挖掘 ≈ 研究数据分析,尤其是大数据量/复杂的数据集 例:人脸形状 (随机事件、概率与统计学习) 统计学习的基本问题 有监督/无监督学习 有监督学习:回归、分类 无监督学习:概率密度估计、聚类、降维 增强学习 模型选择 模型评价:损失函数 模型选择 复杂性 vs. 推广性 课程目的 为计算机专业的学生快速提供广泛的概率和统计背景 概率 统计 统计学习 为学习其他课程打好统计学基础 机器学习 数据挖掘 模式识别 人工智能 … 数学基础的重要性 研究数据分析必须打好概率和统计基础 Using fancy tools like neural nets, boosting and support vector machines without understanding basic statistics like doing brain surgery before knowing how to use a band-aid. 教材/参考书 [Wasserman] Larry Wasserman, All of Statistics: A Concise Course in Statistical Inference, Springer Press, 2004 主要教材:内容很全,但有些部分篇幅略少,更偏向于从统计的角度讲述 Chp1-13, Chp20,Chp23-24 [HTF] Trevor Hastie, Robert Tibshirani, Jerome Friedman著,范明,柴玉梅,昝红英译,《统计学习基础—数据挖掘、推理与预测》, 电子工业出版社,2004 统计学习部分的主要教材:主要从机器学习的角度讲述 Chp1-7 [CB] George Casella and Roger L. Berger,Statistical Inference,机械工业出版社,2002 详尽的统计推断教材:可以作为[Wasserman]一书的补充 Chp1-10 预修课程 高等数学 线性代数 概率:有一定概率基础 可复习任一本科概率论教材 盛骤 谢式千 潘承毅,《概率论》, (浙江大学)编, 高等教育出版社 课程内容(1) 第一部分:概率基础知识 概率理论 随机变量及其概率分布 常用的概率分布 多元随机变量 概率不等式和收敛性 第二部分:统计基础知识 统计基本知识 非参数估计、Bootstrap、Jackknife 参数估计 假设检验 课程内容(2) 第三部分:统计学习基本模型及理论 统计学习概述 线性回归 概率密度估计 核方法 统计判决理论 模型选择和模型评估 第四部分:随机计算 采样、MCMC (Monte Carlo Markov Chain) 相关会议、刊物 会议 Internet Conference on Machine Learning KDD (Internet Conference on Knowledge Discovery and Data Mining) NIPS (Neural Information Processing Systems Conference) IJCNN ( Internet Joint Conference on Neural Networks) Artificial Intelligence and Machine Learning Conference Computational Learning Theory (COLT) … 刊物 Machine Learning (ML) Journal of Machine Learning Research Annals of Statistics Data Mining and Knowledge Discovery IEEE-KDE IEEE-PAMI Artifici

文档评论(0)

ailuojue1 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档