统计学章节整理good.docVIP

  1. 1、本文档共15页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第一章 导论 ●统计学:收集、处理、分析、解释数据并从数据中得出结论的科学。其目的是探索数据的内在数量规律性,以达到对客观事物的科学认识。 1.2 数据统计的类型 1.按计量尺度划分:定类尺度(分类数据)、定序尺度(顺序数据)、定居尺度定比尺度(数值型数据) 【品质数据(定性数据):分类数据、顺序数据;数量数据(定量数据):数值型数据】 2. 按搜集方法划分:观测数据、实验数据 3. 按时间状况划分:截面数据、时序数据 变量:说明现象某种特征的概念,从一次观察到下一次观察,结果会呈现出变化。 变量值:变量的具体取值 分类变量 顺序变量 数值型变量(离散型变量连续型变量) 例:一项调查表明,消费者每月在网上购物的平均花费是200元,他们选择在网上购物的主要原因是“价格便宜”。要求: (1)这一研究的总体是什么?(2)“消费者在网上购物的原因”是分类变量、顺序变量还是数值型变量? (3)研究者所关心的参数是什么?(4)“消费者每月在网上购物的平均花费是200元”是参数还是统计量? (5)研究者所使用的主要是描述统计方法还是推断统计方法? 第二章 数据的搜集 数据的直接来源 —— 一手资料 调查——调查数据 实验——实验数据 调查的方式:普查、抽样调查、统计报表…… 数据的间接来源 —— 二手资料(统计公报、统计年鉴、网上资料、期刊、杂志、报纸……) 2.2 抽样调查——概率抽样、非概率抽样 概率抽样:也称随机抽样,指遵循随机原则进行的抽样,总体中每个单位都有一定的机会被选入样。 特点:★以随机原则抽取样本★每个单位被抽中的概率是已知的★用样本估计总体时,要考虑入样概率 (概率抽样 ≠ 等概率抽样) 1)简单随机抽样:从包括总体N个单位的抽样框中随机地、一个一个地抽取n个单位作为样本,每个单位入样的概率是相等的。 2)分层抽样:将抽样单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本。 3)整群抽样:将总体中若干个单位合并为组,这样的组称为群,抽样时直接抽取群,然后对中选群中的所有单位全部实施调查。 4)系统抽样:将总体中的所有单位按一定顺序排列,按照拟抽样数,将其划分成相同的段,然后在每一段中的固定位置抽取一个调查单位。 5)多阶段抽样: 先按整群抽样的方法,抽取群,再从选中的群中随机抽取若干单位进行调查,这是二阶段抽样。多阶段抽样以此类推。 非概率抽样 方便抽样 容易实施、自行确定、成本低 判断抽样 根据经验、判断、对研究对象的了解抽样 自愿样本 自愿参加 滚雪球抽样 针对特定稀少群体的研究 配额抽样 先分类,在每类中用方便抽样或判断抽样选取样本 非概率抽样 概率抽样 ●不依据随机原则 ●样本无法对总体估计,不计算估计误差、置信区间…… ●操作简便●时效快●成本低●前期发现问题 ★随机原则 ★样本可以对总体进行估计,计算估计误差、置信区间…… ★技术含量高★成本较高 ★适合用于验证问题作进一步的数量分析 搜集数据的基本方法:自填式,面访式,电话式 数据的误差:(1)抽样误差:由于抽样的随机性引起的样本结果与总体真值之间的误差只在概率抽样中 (2)非抽样误差:除抽样误差之外的,由于其他原因引起的样本观察结果与总体真值之间的差异。存在于任何抽样或调查中 第三章 数据的图标展示 3.1 数据的预处理:是在队数据分类或分组之前所做的必要处理,内容包括数据的审核、筛选、排序等。 1. 数据审核(发现数据中的错误)2. 数据筛选(找出符合条件的数据)3. 数据排序(发现数据基本特征、升序和降序) 分类数据的排序:字母型数据,排序有升序降序之分,但习惯上用升序 汉字型数据,可按汉字的首位拼音字母排列,也可按笔画排序,其中也有笔画多少的升序降序之分 数值型数据的排序: (1)递增排序:设一组数据为X1,X2,…,XN,递增排序后可表示为:X(1)X(2)…X(N) (2)递减排序可表示为:X(1)X(2)…X(N) 数据透视表功能:简化数据分析人员的工作量,使其能快速准确地从各个角度查看数据。※ 在利用数据透视表时,数据表的首行必须有列标题。 3.2 品质数据的整理与展示 3.2.1 分类数据的整理与图示 1. 列出各类别2. 计算各类别的频数3. 制作频数分布表4. 用图形展示 分类数据中需要计算的指标 1频 数:落在各类别中的数据个数 频数分布:把各个类别及落在其中的相应频数全部列出,并用表格形式表现出来。 2.比 例:某一类别数据占全部数据的比值 3.百分比:将对比的基数作为100而计算的比值 4.比 率:不同类别数值的比值 如何利用Excel计算频数(插入 —— 函数 —— countif) 分类数据的图

文档评论(0)

hgcm729 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档