- 1、本文档共41页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第三讲 DPS应用(3、多元统计分析)
(六)判别分析 逐步判别分析 在判别分析中,对判别结果可能产生影响的变量往往很多,但是影响有大有小。如果不加选择地一概采用来建立判别函数,不仅计算工作量大,而且往往由于变量间的自相关性,可使求解逆矩阵的计算精度下降,最终使得判别函数缺乏稳定性。因此,适当筛选变量是判别分析中一件很重要的事情。 凡具有筛选能力的判别分析方法统称为逐步判别分析。与通常的判别分析一样,逐步判别也有许多不同原则,从而产生各种不同的方法。这里所讨论的逐步判别分析法是在多组判别基础之上发展起来的一种方法,判别准则为贝叶斯(Bayes)判别函数。其基本思路与逐步回归分析类似,采用“有进有出”的算法,即变量按其重要与否逐步引入,原引入的变量也可能因后来引入的新变量而使之丧失重要性最终被剔除。每步引入或剔除变量都要作相应的统计检验,使最后的贝叶斯判别函数仅保留“重要”的变量。 (六)判别分析 逐步判别分析 在DPS 平台上,数据按一行一个样本、一列一个变量的格式依次输入,最右边一列为已知样本的类别号(用1,2,…表示),将待判别样本的类别用0代替。然后将所有数据(连同类别一起)定义成数据块,在菜单下选项执行。 (六)判别分析 逐步判别分析 例:胡秉民(1987)对浙江北部地区嘉兴、桐乡和湖州1950~1982 年大麦赤霉病发生程度与气象因子关系进行研究,总结出上年12 月降雨量(x1)、上年10月下旬至11 月中旬和当年1~2 月总雨量(x2)、上年10 月下旬至11 月上旬日照时数(x3)、上年10 月下旬至12 月中旬和当年2 月总雨量(x4)以及当年3 月中旬平均高温(x5)等5 个因子,并将病情分为轻、中、重三级(分别用1、2、3 表示)。 (六)判别分析 逐步判别分析 然后进入菜单,选择“多元分析→判别分析→逐步判别分析”功能项,回车执行时系统在自行给出的置信水平(0.1)的F 临界值(2.2134)下进行分析,并筛选出一个以上的因子建立判别函数。然后显示当前判别的效果,并提示用户是否改变F临界值 如想改变Fx 临界值,则点Yes,然后输入新的Fx临界值。若输入0,将进行多组判别分析;若输入的F值大于0,则将进行逐步判别分析。在分析过程中,可根据所选因子的判别效果而调整F 临界值以获得最好的拟合效果。 (七)多因子分析 多因素分析是一种将多变量(指标)样本在结构上进行简化的有效方法。通过分析找到一个包含最佳变量的子集合,使其所包含的变量能反映总体的结构。 主成分分析 主成分分析是把多个指标化为少数几个综合指标的一种统计分析方法。在多指标(变量)的研究中,往往由于变量个数太多,且彼此之间存在着一定的相关性,因而使得所观测的数据在一定程度上有信息的重叠。当变量较多时,在高维空间中研究样本的分布规律就更麻烦。主成分分析采取一种降维的方法,找出几个综合因子来代表原来众多的变量,使这些综合因子尽可能地反映原来变量的信息量,而且彼此之间互不相关,从而达到简化的目的。 (七)多因子分析 主成分分析 例如,罗积玉 (1985)在土壤质量研究中抽取了20个样本,每样本4个指标,包括淤泥含量(x1)、粘土含量(x2)、有机物含量(x3)和土壤pH值(x4)。数据编辑和定义如图 在菜单下选择“多元分析→多因素分析→主成分分析”项,执行后得出结果 (七)多因子分析 因子分析 在统计学中,因子分析属于多元分析的范畴。它用于研究相关矩阵的内部依赖关系,它将多个变量综合为少数几个“因子”,但仍可再现原始变量与“因子”之间的相关关系。 它主要应用于两个方面:一是将为数众多的变量减少为几个新因子,再现系统内变量之间的内在联系;二是用于分类,根据变量或者样本的因子得分值在因子轴所构成的空间中进行分类处理。 (七)多因子分析 因子分析 因子分析与主成分分析的区别: 主成分分析不能作为一个模型来描述,它只能作通常的变量变换,而因子分析需要构造因子模型; 主成分分析的主分量数m 和变量数p 相等,它是将一组具有相关性的变量变换为一组独立的变量,而因子分析的目的是使m 比p 小,而且要选取尽可能小的m,以便构造一个结构尽可能简单的模型; 主成分分析将主分量表示为原观测变量的线性组合,而因子分析将原观测变量表示为新因子的线性组合,即为新因子的综合指标。 所以,因子分析是主成分分析的发展和延伸。 (七)多因子分析 因子分析 因子分析的结果不仅要给出因子模型,而且要得出变量和因子间的相关系数,并由这些相关系数构成“因子结构”。一个完全的因子解包括因子模型和因子结构两个方面,因子结构反映变量与因子间的相关关系,而因子模型则是以回归方程的形式将变量表示为因子的线性组合。 罗积玉等运用因子分析方法研究影响小春粮食总产量的指标共有9 个:小春粮食播种面积x1、小麦播种面积x2、小麦良种推广比例x3、化肥用量x
文档评论(0)