- 1、本文档共36页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
数据挖掘中的统计学参考资料:Wiki:统计学研究者July的CSDN蜗牛向前冲2013年6月2日星期日
纲要概率论条件概率全概率贝叶斯公式离散型随机变量连续型随机变量概率论总结数理统计数学期望方差协方差相关系数主成分分析中心极限定理χ2分布、t分布、F分布正态分布简史正态分布简史误差计算中英文对照概率分布集中趋势离散程度分布形态2013-06-02Sunday2
概率论条件概率全概率贝叶斯公式离散型随机变量连续型随机变量概率论总结2013-06-02Sunday3
条件概率定义:在同一个样本空间Ω中的事件A、B,如果从Ω中随机选出的一个元素属于B,那么这个随机选出的元素也属于A的概率就定义为B条件下A发生的条件概率,即为P(A|B)=|A∩B|/|B|分子、分母同除以|Ω|,得到条件概率的公式:P(A|B)=P(A∩B)/P(B)亦称为后验概率。P(A|B)与P(B|A)的关系为:P(A|B)×P(B)=P(B|A)×P(A)2013-06-02Sunday4
全概率公式?2013-06-02Sunday5
贝叶斯公式?2013-06-02Sunday6
贝叶斯公式正概率是由原因推结果(现在推未来),称为概率论某药厂用从甲、乙、丙三地收购而来的药材加工生产出一种中成药,三地的供货量分别占40%,35%和25%,且用这三地的药材能生产出优等品的概率分别为0.65,0.70和0.85,求从该厂产品中任意取出一件成品是优等品的概率。〔0.7175〕逆概率是由结果推原因(现在推过去),称为数理统计如果一件产品是优质品,它的材料来自甲地的概率有多大呢?(0.3624)2013-06-02Sunday7
离散型随机变量?2013-06-02Sunday8
连续型随机变量?2013-06-02Sunday9
连续型随机变量??2013-06-02Sunday10
连续型随机变量图片来源:《大嘴巴漫谈数据挖掘》2013-06-02Sunday11
概率论总结图片来源:《概率论与数理统计》盛骤版2013-06-02Sunday12
概率论总结图片来源:《概率论与数理统计》盛骤版2013-06-02Sunday13
数理统计数学期望方差协方差相关系数主成分分析中心极限定理χ2分布、t分布、F分布2013-06-02Sunday14
数学期望MathematicalExpectation随机变量X的期望值vs样本均值积分的本质亦是求和例:掷色子一次,期望值为3.52013-06-02Sunday15
方差Variance方差:变量距其期望值的距离;亦称为二阶矩2013-06-02Sunday16
协方差Covariance?协方差矩阵两个向量的协方差cov(X,Y)和cov(Y,X)互为转置矩阵2013-06-02Sunday17
相关系数CorrelationCoefficient??而实际上,上述数据的函数关系为y=0.10+0.01x;E(x)=3.8,E(y)=0.138,x-E(x)、y-E(y)得x=(?2.8,?1.8,?0.8,1.2,4.2)、?y=(?0.028,?0.018,?0.008,0.012,0.042),得皮尔逊相关系数2013-06-02Sunday18
相关系数CorrelationCoefficient2013-06-02Sunday19
主成分分析PrincipalComponentAnalysis又称主分量分析,PCA指将多个变量通过线性变换以选出较少个数重要变量的方法,在减少数据集维数的同时,保持数据集的对方差奉献最大的特征。PCA的目的是使变换后的数据有最大的方差,这些性质不同于普通模型为求稳定性往往会减小方差;主要方法:对协方差矩阵进行特征分解,得出数据的主成分(特征向量)和权值(特征值)步骤:数据标准化;求特征协方差矩阵;通过正交变换使非对角线的元素为0,求得特征值和特征向量;对特征值降序排列,取最大k个组成特征向量矩阵;投影矩阵=原始样本数据×特征向量矩阵;(理论依据为SVD)2013-06-02Sunday20
中心极限定理?独立变量和?2013-06-02Sunday21
中心极限定理??独立同分布变量和?2013-06-02Sunday22
中心极限定理?此定理表明:二项分布的极限是正态分布;二项分布是离散分布,正态分布是连续分布n重伯努利试验在出现第r个A前A不出现的试验次数的概率分布为负二项分布,又称帕斯卡分布。独立同分布?2013-06-02Sunday23
中心极限定理??若序列满足李雅普若夫条件:?独立变量2013-06-02Sunday24
χ2分布、t分布、F分布在正态分布、中心极限定理确立之下,20
文档评论(0)