- 1、本文档共59页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
统计基本知识复习
统计基本知识复习 李孜 第一部分 统计的概念和理念 什么是统计 从一个故事说起: 一辆火车行驶在草原上,遇到了一群白色的羊----- 物理学家说,我们看到的羊群是白色的。 数学家说,我们看到的羊群朝向我们这面的那部分是白色的。 统计学家说,我们看到了103只羊,他们都是白色的,我推断天下的羊都是白色的。 ?物理学务实 ?数学家严谨 ?统计学家实用? Statistics:the science of collecting, analyzing, presenting, and interpreting data. ?Copyright 1994-2000 Encyclopaedia Britannica, Inc. 统计数据的内在规律 正常条件下新生婴儿的性别比为107:100 投掷一枚均匀的硬币,出现正面和反面的频率各为1/2;投掷一枚骰子出现1~6点的频率各为1/6 农作物的产量与施肥量之间存在相关关系 统计学中的几个主要术语 1.总体(Population) –所关心的所有元素的集合 2.样本(Sample) –总体的一部分 3.参数(Parameter) –总体的数字特征 4.统计量(Statistic) –样本的概括性测度值 总体(population)与样本(sample) 总体是根据研究目的所确定的同质研究对象中所有观察单位某变量值的集合。 总体具有的基本特征是同质性,即构成总体的各观察单位必须具有某种共性,这是形成总体的客观依据,也是我们确定总体范围的标准。 总体的三个基本特征 同质性 大量性 差异性 总体的分类 有限总体 无限总体 样本 在实际工作中通常是从总体中随机抽取部分观察单位,其变量值的集合构成样本。 再根据样本信息推断总体特征。这种研究方法称之为抽样研究,是一种常用的,极其重要的科学研究方法。 抽样研究的目的是用样本信息去推断总体特征,所以样本必须具有代表性。“代表性”是在样本来自同质总体、足够的样本含量和随机抽样的前提下实现的。 所谓“随机抽样”,是指遵循随机化原则从总体中抽取样本,有多种随机抽样方法供选用。 抽样方法 1.概率抽样:根据已知的概率选取样本 ??简单随机抽样:完全随机地抽选样本 --重复抽样/不重复抽样 ??分层抽样:总体分成不同的“层”,然后在每一层内进行抽样 ??整群抽样:将一组被调查者(群)作为一个抽样单位 ??等距抽样:在样本框中每隔一定距离抽选一个被调查者 2.非概率抽样:不是完全按随机原则选取样本 ??非随机抽样:由调查人员自由选取被调查者 ??判断抽样:通过某些条件过滤来选择被调查者 3.配额抽样:选择一群特定数目、满足特定条件的被调查者 参数与统计量 在统计学中,描述总体变量特征的指标称为参数(parameter); 描述样本变量值特征的指标称为统计量(statistics)。 统计学基础概念 同质(homogeneity)与变异(variation) 严格地讲,同质是指被研究指标的影响因素相同。但在许多研究中,有些影响因素往往是难以控制的(如遗传、营养等),甚至是未知的。因此,在实际工作中只有相对的同质。 在统计学中可以把同质理解为对研究指标影响较大的、可以控制的主要因素尽可能相同。 同质基础上的各观察单位间的差异称为变异。如同性别、同年龄、同民族、同地区健康儿童的身高、体重不尽相同;相同病种、病程的病人,使用同一疗法,却未必有相同疗效。这些不同就是变异。 统计学的理念 ?统计模型的严格数学表达很复杂、繁琐,但是其背后的思想往往很简单 ?做为统计学的使用者,重要的是掌握统计学的思想、解决问题的步骤和结果的解读,至于那些研究方法本身的事情,交给统计学家去做吧 ?复杂的方法未必是可行的方法,越是简单的方法,越容易得到广泛采用,也往往给使用者带来更多的价值。统计分析方法是工具,哪件合适就用哪件,能用锤子解决的问题不必开冲床。 ?统计学只是一个工具,SPSS更是工具的工具,不要指望它能够“自动”的解决你面临的商业问题 ?要注意统计学方法的适用条件,滥用统计学会造成“严重”的负效果 第二部分 数据的计量与类型 变量(variable) 在搜集资料时,首先要根据研究目的确定同质观察单位,再对每个观察单位的某项特征进行测量或观察,这种特征称为变量。如上述的“身高”、“体重”、“疗效”就是变量。变量的观察结果或测量值称为变量值(variable value) ,变量按其值的性质可分为不同类型。 数值变量(numerical variable) 分类变量 无序分类变
文档评论(0)