第2章-资料的整理与描述教案资料.ppt

下载文档 降价啦

3
0
约6.65千字
约 88页
2019-08-22 发布于天津
举报
版权申诉
保障服务

第2章-资料的整理与描述教案资料.ppt

1、本文档共88页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

第二章资料的整理与描述 ;一、资料的分类正确地进行资料的分类是资料整理的???提。在田间试验中，由观察、测量所得的资料，按其性质的不同，一般可分为两大类。即：（一）数量性状资料（二）质量性状资料; 指用量测方式获得的数量性状资料，即用度、量、衡等计量工具直接测定而获得的数量性状资料。其数据是用长度、重量、容积等来表示，如小麦的株高、千粒重等。计量资料的观测值不一定是整数，两个相邻整数间允许有带小数的任何数值出现，其小数位数多少由度量工具的精度而定。如小麦的株高为80—100cm，可以是92cm、93cm，也可以是93.5cm或93.56cm。数据间的变异是连续的。因此，计量资料也称为连续性变异资料。; 指用计数方法获得的数量性状资料。计数资料的观察值只能以整数表示，在两个相邻整数间不允许有任何带小数的数值出现。如水稻的分蘖数、单位面积的害虫数、单位叶面积的病斑数等，这些观察值只能以整数来表示，各个观察值是不连续的。因此，计数资料也称为不连续性变量资料或间断性变量资料。; 质量性状(qualitative character) 又称属性性状，是指能观察到而不能直接测量的性状。如花药、子粒、颖壳等器官的颜色、芒的有无、绒毛的有无等。这类性状本身不能直接用数值表示，要获得这类性状的数据资料，须对其观察结果作数量化处理，方法有以下两种： 1、统计次数法 2、评分法 ; 在一定的总体或样本内，根据某一质量性状的类别统计其次数，以次数作为质量性状的数据。例如，红花豌豆与白花豌豆杂交，统计F2代不同花色的植株时，在1000株植株中，有红花266株、紫花494株、白花240株（可进一步计算出三种花色植株出现的百分率分别为：26.6%、49.4%和24.0%）。这种利用统计次数法对质量性状数量化得来的资料又叫次数资料。 ; 这种方法是用数字级别表示某种现象在表现程度上的差别。例如，小麦感染锈病的严重程度可划分为0（免疫）、1（高度抵抗）、2（中度抵抗）、3（感染）级。又如，观察施用某种农药后害虫的死亡情况，记“死”为0，记“活”为1等。 ;二、资料的检查与核对 ; 试验资料经检查核对后，根据样本大小确定是否分组。对小样本（n≤30）资料不必分组，直接进行统计分析。当样本较大（n＞30）时，宜将观测值分成若干组，制成次数分布表，以了解资料集中与分散的情况。不同类型的资料，整理方法不同。 ;1、计数资料的整理;引例; ; 有些计数资料，观察值较多，变异范围较大，若以每一观察值为一组，则组数太多而每组所包含的观察值太少，资料的规律性显示不出来。对于这样的资料，可扩大为几个相邻的观察值为一组，适当减少组数，分组后，资料的规律性就较明显。;引例; 计量资料在分组前需要确定全距、组数、组距、组中值及组限，然后将全部观测值划线计数归组制成次数分布表。下面以表2-4中140行水稻产量为例，说明计量资料整理的方法与步骤。; 全距是资料中最大值与最小值之差，又称为极差(range)，用R表示，即 R=Max(x)-Min(x) 表2-4中，水稻产量最大观测值为254g，最小观测值为75g，因此，全距为： R = 254 – 75 = 179（g） ; 组数的多少视样本容量及资料全距的大小而定，一般以达到既简化资料又不影响反映资料的规律性为原则。组数要适当，不宜过多，亦不宜过少。分组越多所求得的统计数越准确，但增大了运算量；若分组过少，资料的规律性就反映不出来，计算出的统计数的准确性也较差。一般可参考表2-5由样本容量确定组数。 ; 组距：是指每组的最大值与最小值之差，记为i。分组时要求各组的组距相等。组距的大小由全距和组数确定，计算公式为：组距（i）= 全距/组数;; 各组的最大值与最小值称为组限，最小值称为下限，最大值称上限。每一组的中点值称为组中值，是该组的代表值。组中值与组限、组距的关系为：组中值 = （组下限+组上限）/2 = 组下限 + 组距/2 = 组上限 - 组距/2 ; 由于相邻两组的组中值之差等于组距，所以当第一组的组中值确定后，加上组距就是第二组的组中值，第二组的组中值加上组距就是第三组的组中值，其余类推。在资料分组时为了避免第一组中的观测值过多，第一组的组中值以接近或等于资料中的最小观测值为好。第一组的组中值确定后，则该组组限也随之确定，其余各组的组中值和组限也可相继确定。注意，最后一组的上限应大于资料中的最大值。;