二资料分类.pptVIP

  1. 1、本文档共70页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
二资料分类

第二章 资料的整理 第一节 资料的分类 一、资料的分类 在调查或试验中,由观察、测量所得的数据按其性质的不同,一般可分为两大类。 (一)连续性资料: 连续性资料(continuous data),是指在一定范围内可取任何实数值的数据资料。它们通常是用度、量、衡等计量工具直接测量后得到的,也称为计量资料。 其数据是用长度、容积、重量等来表示,如体高,产奶量、体重等,这类数据资料的特点是各个观测值不限于整数,两个相邻的整数间可以有带小数的任何数值出现,其小数的位数随测量仪器或工具的精确性而变化。 (二)、离散性资料 离散性资料(discrete data)是指在一定范围内只取有限种可能值的数据资料。间断性资料又可进一步分为计数资料和分类资料两种。 1、计数资料(counting data),是指用计数方式得到的数据资料。 在这类资料中,以自然数1为基本计数单位,各观察值都以整数表示,相邻两整数间没有小数存在。如产仔数、产蛋数,发病数、死亡数、呼吸次数等。由于各观察值以整数表示,没有小数,是不连续的。因此,该类资料也称为不连续性变异资料或间断性变异资料。 2、分类资料(categorical data),是指可自然或人为地分为两个或多个不同类别的资料。 有些能观察到而不能直接测量的性状资料。如:性别、毛色、生死等。这类性状本身不能直接用数值表示,要获得这类性状的数据资料,须对其观察值作数量化处理再统计其次数分析 。例如: 性别 二类 ♂(1) ♀(0) 毛色 三类 黑 (1) 白(2) 花(3) 血型 四类 A(1) B(2) O(3) AB(4) 绵羊毛油汗色泽 五类(评分) 深黄(1) 、黄(2) 、浅黄(3) 、乳白(4) 、白(5) 第二节 资料的整理 一、资料的检查与核对 检查和核对原始资料的目的在于确保原始料的完整性和正确性。 所谓完整性是指原始资料无遗缺或重复。 所谓正确性是指原始资料的测量和记载无差错或未进行不合理的归并。检查中要特别注意特大、特小和异常数据(可结合专业知识作出判断)。对于有重复、异常或遗漏的资料 ,应予以删除或补齐 ;对有错误、相互矛盾的资料应进行更正,必要时进行复查或重新试验。 二、资料的整理方法 当观测值不多(n≤30)时,不必分组,直接进行统计分析。 当观测值较多(n30)时,宜将观测值分成若干组,以便统计分析。将观测值分组后,制成次数分布表,即可看到资料的集中和变异情况。 不同类型的资料,其整理的方法略有不同。 (一)离散性资料的整理 对于观察值较少,变异范围较小,以每一观察值(或自然值)为一组,作次数分布表。 对于观察值较多,变异范围较大的离散性资料,可扩大为以几个相邻观察值(或自然值)为一组,适当减少组数,这样资料的规律性较明显,对资料进一步计算分析也比较方便。 例1:以50枚受精种蛋孵化出雏鸡的天数为例,说明计数料的整理。 表1 50枚受精种蛋孵化出雏鸡的天数 小鸡出壳天数在19─24天范围内变动 ,有6个不同的观察值。用各个不同观察值进行分组,共分为6组,可得表2形式的次数分布表。 表2 50枚受精种蛋出雏天数的次数分布表 例:对100例断奶仔猪附红细胞体病例的血液涂片显微镜下病变红细胞数资料进行整理分组。 (二)、连续性资料的整理 对于连续性资料的分组整理,常采用组距式分组法。在分组前需要根据数据的多少确定组数、组距、各组的上下限及组中值,然后将全部观测值按其数值大小归组,划线计数,制成次数分布表。 例:将126头基础母羊的体重资料(见表3)整理成次数分布表。 表3 126头基础母羊的体重资料 单位:kg 1、求全距 :全距是资料中最大值与最小值之差,又称为极差 (range),用R表示,即 : R=最大值—最小值。 本例: R=最大值—最小值=65.0—37.0=28.0(kg) 2.确定组数: 组数的多少应根据样本含量、资料的变异范围大小及要求精确度的高低而定。一般组数的确定可参考表4。

文档评论(0)

ipad0d + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档