- 1、本文档共47页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
(2)相关性输出,“相关性”表格给出的是Pearson相关系数及其检验结果:“相关系数”表格给出的是两个非参数相关系数及其检验结果。可见,3个相关系数在0.01和0.05的显著性水平(双边检验)上都非常显著,从而推断体重和肺活量之间存在着明显的正相关关系。 (1)描述性输出,“描述性统计量”表格给出了两个变量的基本统计信息,包括均值、标准差和频率。 偏相关分析也称净相关分析,它在控制其他变量的线性影响下分析两变量间的线性相关,所采用的是工具是偏相关系数(净相关系数)。运用偏相关分析可以有效地揭示变量间的真实关系,识别干扰变量并寻找隐含的相关性。 Partial过程,当进行相关分析的两个变量的取值都受到其他变量的影响时,就可以利用偏相关分析对其他变量进行控制,输出控制其他变量影响后的相关系数。 Partial 过程 偏相关分析 (一)偏相关系数 (1)含义: 在控制了其他变量的影响下计算两变量的相关系数。 虚假相关.如:小学1~6年级全体学生进行速算比赛(身高和、分数间的相关受年龄的影响) 研究商品的需求量和价格、消费者收入之间的关系.因为:需求量和价格之间的相关关系包含了消费者收入对商品需求量的影响;收入对价格也产生影响,并通过价格变动传递到对商品需求量的影响中。 又如:粮食产量与平均气温、月降水量、平均日照时间、温度之间的关系的研究。 控制变量个数为1时,偏相关系数称一阶偏相关;当控制两个变量时,偏相关系数称为二阶偏相关;当控制变量的个数为0时,偏相关系数称为零阶偏相关,也就是简单相关系数。 控制了z的条件下,x、y之间的偏相关系数 : 控制了两个变量z1、z2,变量x、y之间的偏相关系数: Pearson偏相关系数假设检验的t统计量: 其中,r是相应的偏相关系数,n是观测量数,k是控制变量的数目, n-k-2是自由度。当tt0.05(n-k-2)时,p0.05拒绝原假设 返回 (一)偏相关系数 (2)偏相关的有关公式: 偏相关分析 (二)基本操作步骤 (1).菜单选项:analyze-correlate-partial… (2).选择将参加计算的变量到variable框. (3).选择控制变量到controlling for 框。 (4)option选项: zero-order correlations:输出简单相关系数矩阵 (三)应用举例 例10-1-2 偏相关分析 偏相关分析的主对话框 返回 偏相关的选择项对话框 返回 举例:分析身高与肺活量之间的相关性,要控制体重在相关分析过程中的影响。 依次单击“Analyze-Correlate-Patial”执行偏相关分析。其主设置面板如图所示: 0阶偏相关 (Pearson) 1阶偏相关 显著相关 相关不显著 (1)描述性输出,“描述性统计量”表格给出了三个变量的基本统计信息,包括均值、标准差和频率。 (2)相关性输出,“相关性”表格给出了所有变量的0阶偏相关(Pearson简单相关)系数和1阶偏相关系数的计算结果果、以及它们各自的显著性检验P值。分析结果显示:在体重 不变的条件下,身高与肺活量之间不存在显著 线性相关关系。 距离分析:此过程可以在观测记录之间或者不同变量之间进行相似性和不相似性分析。相似性分析可以用于检测观测值的接近程度,不相似性分析可用于考察各变量的内在联系和结构。该过程一般不单独使用,而是作为因子分析、聚类分析和多维尺度分析等的预分析过程,以帮助了解复杂数据集的内部结构,为进一步的分析做准备。 与距离分析有关的统计量分为相似性测度和不相似性测度两大类。 Distances过程 相关分析和偏相关分析都是研究变量之间的线性相关关系;但很多情况下,需要考察变量间的相似关系。 距离相关分析就是通过“距离”的大小研究观测量间或变量间的相似程度或不相似程度。分为两类: 观测量间的距离相关分析用于考察观测量间的相互接近程度。 变量间的距离相关分析用于考察观测值对实际值的拟合程度或变量间的相似程度。 适用对象:等间隔数据资料、计数资料及二值资料。 使用统计量分为: 1、不相似性统计量 对等间隔数据资料:Euclidean distance(欧氏距离)、 squared Euclidean distance(欧氏距离平方)等; 对计数资料:Chi-squared(卡方)和Phi-squared(裴方) 对二值资料:Euclidean distance(欧氏距离)、 squared Euclidean distance(欧氏距离平方)、size difference(尺寸差异)、Variance(方差)等; 2、相似性统计量 对等间隔数据资料:Pearson correlation和cosine(余弦度
文档评论(0)