- 1、本文档共11页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
试验资料的整理和特征数
第四章 试验资料的整理与特征数
试验中通过观察、测量获得大量的数据,如何从这些数据中获得有价值的信息,就要对其进行初步整理,找出内在规律、特征,这对于做好试验结果统计分析有重要意义。
第一节 常用的统计术语
一、资料、观察值、变数
试验中需要对试验的生物体进行一系列的观察和记载。经过调查和记载得到该生物体各种性状的大量的数据,这些数据称为资料。由于同一生物各不同个体在相同性状上有差异,表现出变异。例如,调查某地某一小麦品种100个麦穗的每穗小穗数,由于受许多偶然因素的影响,可能每穗小穗数不一样。“每一个体的某一性状的测定数值叫观察值。组成总体或样本的一群观察值的集合称为变数。由于个体间属性相同,但受随机影响造成观察值或表现上的变异,因此变数又称为随机变数。
二、总体与样本
总体指的是具有共同性质的个体所组成的集团。总体又分为有限总体和无限总体。有限总体指的是总体中包含的个体数是有限的,可以计数。无限总体指的是总体中包含的个体是无限的,数不 清的,只是表示包括的个体数大到无限。例如小麦品种冀麦23的总体,指的是冀麦23这一品种在多年多地的种植中所有的个体,它是无法计数的,这一总体称为无限总体。对某一块地的小麦株数,虽然多但是可数,这样的总体称为有限总体。统计上有关取样误差的计算大多数假设来自无限总体。用N表示总体容量。
样本指的是从总体内抽样取出来的若干个个体,或者说是总体的一部分个体。样本是用来研究总体的。生产试验研究中常用样本的事实来反映总体的情况,因为总体太大,不可能也不允许我们对其逐个研究。例如,对于某一小麦品种的穗分化情况调查,我们不能把这一品种的每一株都拔来放在显微镜下观察,同时也不允许这样做。因此,一般用样本来研究总体。用n表示样本容量。
样本有大有小。一般n≥30为大样本,n<30为小样本。
三、参数与统计数
由总体的全部观察值计算得到的总体特征数为参数,它是该总体真正的值,是固定不变的。由样本观察值计算得到的样本特征数为统计数,它因样本不同常有变动。它是估计值,根据样本不同而不同。例如水稻品种南优2号的株高,其总体平均值为95cm,它是一个真值,为参数,而从中抽取出来的样本的平均数为91.4cm,它是估计值,为统计数。
因为总体参数不易获得,我们通常用统计数来估计参数,一般的参数用希腊字母表示,统计数用拉丁字母表示。如平均数,总体平均数用μ表示,样本平均数用表示,用估计μ。
第二节 资料的整理
一、试验资料的类别
试验中观察记载所得数据,因所研究的性状不同而有不同的性质,一般可以分为数量性状资料和质量性状资料两大类。
(一)数量性状资料
指能够以测量、称量、度量或计数的方法所获得的资料,这类资料有两种。
1、连续性变数资料 指由称量、度量或测量等方法得到的资料,各个观察值不限于整数,在两个相邻数值之间,可以有微量差异。例如树高、株高、产量、千粒重等。
2、非连续性变数资料 也称间断性变数资料,指用计数的方法得到的资料,各个观察值必须以整数表示,如株数、籽粒数、叶片数等。
(二)质量性状资料
指能观察不能测量的性状,又称属性性状,如花色、叶色、品种的抗病性等。从这类
性状获得资料,一般可采用两种方法统计。
1、统计次数的方法 在一定的总体内,统计具有某性状的个体数目及具有不同性状的个体数目,按类别统计其次数或相对次数。例如,在200株豌豆中,有140株紫花占70%,60株白花占30%,这类资料称为次数资料。
2、给予每类性状相当数量的方法 例如小麦籽粒颜色有白有红,可令白色为0,红色为1,再如红星苹果果实的色泽,按着色面积的大小分5、4、3、2、1级。这类资料可以与间断性变数资料一样处理。
二、资料的整理
田间试验或调查研究得到的资料,未经整理之前是杂乱无章的,很难找出其规律。所以对于资料处理的第一步是进行整理,把观察值的数据按大小加以整理后,便可以看到资料的集中和变异情况,对资料有一个初步的认识。资料的整理有两种常用方法。
(一)次数分布表
将观察值按大小进行分组统计次数,编制成表格形式即为次数分布表。次数分布表因资料的类别不同而有差异。
1、非连续性变数资料的整理 现以某种小麦品种的每穗小穗数为例来说明这类资料的整理方法。随机抽取100个麦穗,计数每个麦穗的小穗数,其资料如表4-1。
上述资料是非连续性变数资料,每穗小穗数的变动范围在15~20之间,把所有的观察值按每穗小穗数多少加以归类,共分6组,组与组之间相差1个小穗,这一小穗称为组距。每一个观察值按其大小归到相应的组内,每增加1个画一横道,一般用“正”字表示。用“f”表示每组出现的次数。这样就可得到表4-2形式的次数分布表。
从表4-2中看出,原本杂乱无章的资料,经初步整理后,就可以看出其大概情况,如每穗小穗数以17个为
文档评论(0)