2014贾俊平 统计学 总结.docVIP

  1. 1、本文档共10页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第一章 导论 概念: 统计学:收集、处理、分析、解释数据井从数据中得出结论的科学。 统计的分类: 描述统计:研究的是数据收集,处理,汇总,图表描述,文字概括与分析等统计方法。 推断统计:是研究如何利用样木数据进行推断总体特征。 数据: 1.分类数据:对事物进行分类的结果数据,表现为类别,用文字来表述。例如,人口按性别分为男、女两类 2.顺序数据对事物类别顺序的测度,数据表现为类别,用文字来表述例如,产品分为一等品、二等品、三等品、次品等 3.数值型数据对事物的精确测度,结果表现为具体的数值。例如:身高为175cm,190cm,200cm 参数:描述总体特征。有总体均值(μ)、标准差()总体比例(T) 统计量:描述样本特征,样本标准差(s),样木比例(p) 第二章 数据的搜集 数据来源包括直接来源(一手数据)和间接来源(二手数据) 抽样方式包括概率抽样与非概率抽样 概率抽样:也称随机抽样。按一定的概率以随机原则抽取样本,抽取样本时使每个单位都 有一定的机会被抽中。 抽样误差:是由抽样的随机性引起的样本结果与总体真值之间的误差。抽样误差并不是针对某个样本的检测结果与总体真是结果的差异而言,抽样误差描述的是所有样本可能的结果与总体真值之间的平均差异。 抽样误差的大小与样本量的大小和总体的变异程度有关。 数据的图表展示 计算机实训内容, 要求: 数据筛选,自动筛选 高级筛选, 数据排序 分类汇总-利用数据透视表 对比条形图 环形图 累计频数图 散点图 雷达图 等等 频数分布图两种方法:工具-数据分析-直方图 数值型和顺序数据 数据-数据透视表 数据透视表 第四章 数据的概括性度量 集中趋势: 算数平均数: 几何平均数:指n个观察值连乘积的n次方根计算平均发展速度时复利下的平均年利率,最常用的一种计算公式为几何平均数≤算术平均数有限的数集,可以通过把所有观察值高低排序后找出正中间的一个作为中位数。异众比率指的是总体中非众数次数与总体全部次数之比STDEV 平均差: 相对位置的度量: 标准分数: 离散系数: 形状: 偏态:SK0,正值,正偏或者右偏,,小数集中 SK0,负值,负偏或者左偏,,大数集中。 绝对值 0, 0.5, 1三个界线。 峰态:K0,尖峰,数据分布集中, K0,扁平,数据分布分散。 第五章 概率与概率分布 1.概率的分类:1.概率的古典定义,概率的统计定义,概率的主观定义。 2.期望值:在离散型随机变量X的一切可能取值的完备组中,各可能取值xi与其取相对应的概率pi乘积之和,描述离散型随机变量取值的集中程度,记作E(X),或者μ,其实为加权平均数。 3. 二项分布的数学期望为 E ( X ) = np 方差为 D ( X ) = npq 标准差? 区别二项分布的概率值与期望值。 4. 当二项分布中n很大,p很小时,二项分布就变成为Poisson分布 计算机计算 二项分布计算时候, 已知:1,目标概率 2,实验次数 3,成功次数 公式: 二项分布换泊松分布,已知:1,入=np=1*2 2,成功的次数 (揉合在一起,因为都是那种目标概率小、实验次数多的实验) 入=数学期望值E(X)=方差D(X)=np P119例子,P121例子 正态分布 主要特点:钟型,离μ近的概率大,离μ远的概率小。 标准差小,集中;标准差大,分散。 正态曲线的最高点在均值μ,它也是分布的中位数和众数。 正态分布是一个分布族,每一特定正态分布通过均值μ和标准差σ来区分。 曲线f(x)相对于均值μ对称,尾端向两个方向无限延伸,且理论上永远不会与横轴相交 正态曲线下的总面积等于1。 计算机计算:已知:1,正态分布(的形状)(μ与σ), 2.临界值(右端值,即默认计算的是改值以左部分的面积) 标准正态分布: 期望值μ=0,即曲线图象对称轴为Y轴, 标准差σ=1条件下的正态分布, 记为N(0,1)。”概率”。故称概率函数。 概率密度函数:将直方图组距缩小到很密的程度,故称概率密度函数。 分布函数:分布函数F(x)在x处的函数值就表示X落在区间(-∞,x]上的概率。(-∞,x]是在分布函数上的值,一个范围区间(X1~X2)是分布函数上X2的值-X1的值 8. 正态分布的3σ原则:只要是正态分布,不论标准与否,(可以反过来理解) 数值分布在(μ-σ,μ+σ)中的概率为0.6826 数值分布

文档评论(0)

DohoTgfhlo + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档