第一章_统计数据的收集与整理.ppt

  1. 1、本文档共37页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
生 物 统 计 学 主讲教师:段彦玲 第一章 统计数据的收集与整理 ? 1.1 总体与样本 ? 1.2 数据类型及频数(率)分布 ? 1.3 样本的几个特征数 第一节 总体与样本 1.1.2 总体与样本 总体: 研究对象的全部个体. 无限总体 有限总体 个体:构成总体的每个成员 样本:从总体中抽出的一部分个 体 样本含量:样本中包含的个体数量称为样本含量 1.1.3 抽样(sampling) 定义:从总体中获得样本的过程。 目的:希望通过对样本的研究,推断其总体。 抽样方法:随机数字表 放回式抽样: 非放回式抽样: 样本的含量越大越有代表性 1.2数据类型与频数(率)分布 1.2.1 数据类型 连续型数据:为与某种标准相比较所得到的数 据,又称为度量数据。如长度、重量等,若精 确度提高的话,总会出现小数。对连续型数据 进行分析的方法称为变量的方法。 离散型数据:为纪录不同类别个体的数目所得 到的数据,又称为计数数。所得数据均为整数 。对离散型数据进行分析的方法,通常称为属 性的方法。 1.2.2 频数(率)表和频数(率)图 离散型数据的整理 例:调查新生儿体重增长超过3kg的 人数,每次调查10名,共 调查120天。每天的10名新生儿中,增重超过3kg的人数, 可能有11种情况:1名也没有,有1名,有2名,…, 10名都是,如表1-1的第一列所示,这一组称为组值。 连续型数据频数(率)表和频数(率)图。 例:表1-2列出了某农场在做“三尺三”提纯时所调查的100个数据,试做其频数(率)表和频数(率)图 1、从原始数据中找出最大值和最小值,并求出极 差。R=mamx-minx(R=170-141=30) 2、决定划分的组数,分组数是由数据的多少决定 的,美国统计学家斯特吉斯提出分组数公式: n=1+3.322lgN(式中N为样本数)。 3、根据极差与决定划分的组数、确定组限。 (30/10=3) 4、在频数表中列出全部组限、组界及中值。 5、将原始数据表中数据,填入频数表中,计算出 每组的频数和频率。 总结:编制连续型数据的频数表的步骤 1. 从原始的数据表中找出最大值和最小值,并求出极差 2. 决定划分的组数 3. 根据极差和决定划分的组数,确定组限 4. 在频数表中列出全部组限、组界和种值 5.将原始数据表中数据,用唱票的方式填入频数表中,计算出各组的频数的频率 次数分布图 1.柱形图 2.多边形图(包括饼图、曲线图、折线图、直方图等) 1.3 样本的几个特整数 1 平均数 2 标准差 3 偏斜度和峭度 1 平均数 ?平均数的意义 ?平均数的种类 ?算术平均数的计算方法 ?算术平均数的重要特性 中位数(median) 是将每个变量值从小到大排列,位置居于中间的那个变量值。 2 变 异数 一、极差:极差又称全距。是资料中最大观察值与最小观察值的差数。用“R”来表示。我们举个例子来说明。例如调查两个不同品种的富士苹果的维生素含量,每品种计10个数,经过整理其数字为 样本平方和 总体平方和 用观察值数目来除平方和,得到平均平方和,简称均方或方差,即离均差的平方和,样本均方用s2来表示,定义为 标准差的计算方法 ◆直接法:分四个步骤:先求出 ,再求出各个 和各个 ,求和得 ,即可代入公式求得标准差。 ◆矫正数法:矫正数记为C且 所以 矫正数法用的最多,最普遍,一般用 于非频数资料的计算。 1.3.3 偏斜度和峭度 偏斜度:度量数据围绕众数呈不对称的程度。 一般用三阶中心矩m3 m3=0,说明曲线对称于平均数,此时平均数等于中位数也等于众数。 m3 0,称为正偏,此时众数小于平均数。见图1-5A。 m30,称为负偏,此时平均数小于众数,见图1-5B图 用三阶中心距的两个缺陷: – 单位为物理学单位的立方,因此不同类型数据之间不易进行比较 – 没有计算数据变异的性质,因此没有一个绝对的含义。 ? 标准化的三阶中心距g1 其判断方法与m3是一样的。 峭度g2 : 也是用来度量曲线形状,其值为四阶中心 距m4与二阶中心距m2的平方的商再减去3: g2=0,认为数据是正态的; g20,说明曲线过于陡峭; g2

文档评论(0)

awang118 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档