- 1、本文档共88页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第二章 资料的整理与描述 ;一、资料的分类
正确地进行资料的分类是资料整理的???提。在田间试验中,由观察、测量所得的资料,按其性质的不同,一般可分为两大类。即:
(一)数量性状资料
(二)质量性状资料; 指用量测方式获得的数量性状资料,即用度、量、衡等计量工具直接测定而获得的数量性状资料。其数据是用长度、重量、容积等来表示,如小麦的株高、千粒重等。
计量资料的观测值不一定是整数,两个相邻整数间允许有带小数的任何数值出现,其小数位数多少由度量工具的精度而定。如小麦的株高为80—100cm,可以是92cm、93cm,也可以是93.5cm或93.56cm。数据间的变异是连续的。因此,计量资料也称为连续性变异资料。; 指用计数方法获得的数量性状资料。计数资料的观察值只能以整数表示,在两个相邻整数间不允许有任何带小数的数值出现。如水稻的分蘖数、单位面积的害虫数、单位叶面积的病斑数等,这些观察值只能以整数来表示,各个观察值是不连续的。因此,计数资料也称为不连续性变量资料或间断性变量资料。; 质量性状(qualitative character) 又称属性性状,是指能观察到而不能直接测量的性状。如花药、子粒、颖壳等器官的颜色、芒的有无、绒毛的有无等。这类性状本身不能直接用数值表示,要获得这类性状的数据资料,须对其观察结果作数量化处理,方法有以下两种:
1、统计次数法
2、评分法 ; 在一定的总体或样本内,根据某一质量性状的类别统计其次数,以次数作为质量性状的数据。
例如,红花豌豆与白花豌豆杂交,统计F2代不同花色的植株时,在1000株植株中,有红花266株、紫花494株、白花240株(可进一步计算出三种花色植株出现的百分率分别为:26.6%、49.4%和24.0%)。这种利用统计次数法对质量性状数量化得来的资料又叫次数资料。 ; 这种方法是用数字级别表示某种现象在表现程度上的差别。
例如,小麦感染锈病的严重程度可划分为0(免疫)、1(高度抵抗)、2(中度抵抗)、3(感染)级。又如,观察施用某种农药后害虫的死亡情况,记“死”为0,记“活”为1等。 ;二、资料的检查与核对 ; 试验资料经检查核对后,根据样本大小确定是否分组。
对小样本(n≤30)资料不必分组,直接进行统计分析。
当样本较大(n>30)时,宜将观测值分成若干组,制成次数分布表,以了解资料集中与分散的情况。
不同类型的资料,整理方法不同。 ;1、计数资料的整理;引例; ; 有些计数资料,观察值较多,变异范围较大,若以每一观察值为一组,则组数太多而每组所包含的观察值太少,资料的规律性显示不出来。对于这样的资料,可扩大为几个相邻的观察值为一组,适当减少组数,分组后,资料的规律性就较明显。;引例; 计量资料在分组前需要确定全距、组数、组距、组中值及组限,然后将全部观测值划线计数归组制成次数分布表。
下面以表2-4中140行水稻产量为例,说明计量资料整理的方法与步骤。; 全距是资料中最大值与最小值之差,又称为极差(range),用R表示,即
R=Max(x)-Min(x)
表2-4中,水稻产量最大观测值为254g,最小观测值为75g,因此,全距为:
R = 254 – 75 = 179(g) ; 组数的多少视样本容量及资料全距的大小而定,一般以达到既简化资料又不影响反映资料的规律性为原则。
组数要适当,不宜过多,亦不宜过少。分组越多所求得的统计数越准确,但增大了运算量;若分组过少,资料的规律性就反映不出来,计算出的统计数的准确性也较差。一般可参考表2-5由样本容量确定组数。 ; 组距:是指每组的最大值与最小值之差,记为i。分组时要求各组的组距相等。组距的大小由全距和组数确定,计算公式为:
组距(i)= 全距/组数;; 各组的最大值与最小值称为组限,最小值称为下限,最大值称上限。每一组的中点值称为组中值,是该组的代表值。组中值与组限、组距的关系为:
组中值 = (组下限+组上限)/2
= 组下限 + 组距/2
= 组上限 - 组距/2 ; 由于相邻两组的组中值之差等于组距,所以当第一组的组中值确定后,加上组距就是第二组的组中值,第二组的组中值加上组距就是第三组的组中值,其余类推。
在资料分组时为了避免第一组中的观测值过多,第一组的组中值以接近或等于资料中的最小观测值为好。第一组的组中值确定后,则该组组限也随之确定,其余各组的组中值和组限也可相继确定。注意,最后一组的上限应大于资料中的最大值。;
文档评论(0)