- 1、本文档共26页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
第七章;;相关分析简介;;;二元变量相关分析;二元变量相关分析;二元变量相关分析;第2步对样本来自的两总体是否存在显著的线性关系进行推断:由于存在抽样的随机性和样本数量较少等原因,通常样本相关系数不能直接用来说明样本来自的两总体是否具有显著的线性相关性,需要通过假设检验的方式对样本的总体进行统计推断。
提出零假设H0:即两总体无显著的线性关系;
构造检验统计量:由于不同的相关系数采用不同的检验统计量,因此在相关分析时,不同的过程需要构造不同的检验统计量;
计算检验统计量的观测值及对应的概率p值;
对两总体的相关性进行推断:如果检验统计量的概率p值小于给定的显著性水平,应拒绝零假设,即认为两总体之间存在显著性线性关系;反之,应接受零假设。
;(4)SPSS实现举例
【例7-1】为了分析父亲与儿子身高之间的相关性,现抽样了12对父子的身高,数据如下表。请对其进行相关性分析(显著性水平取α=)。
;
;
;;选择检验统计量:偏相关分析选择的是t统计量;
既可以计算其相似性测度,亦可计算其不相似性测度;
月降雨量月平均日照时数月平均湿度
对二值(只有两种取值)数据变量之间的距离描述,使用欧氏距离、平方欧氏距离、尺寸差异、模式差异、方差、形或兰斯和威廉斯等距离统计量。
第2步对样本来自的两总体是否存在显著的线性关系进行推断:由于存在抽样的随机性和样本数量较少等原因,通常样本相关系数不能直接用来说明样本来自的两总体是否具有显著的线性相关性,需要通过假设检验的方式对样本的总体进行统计推断。
提出零假设H0:即两总体的偏相关系数与零无显著性差异;
第4步主要结果及分析。
二元定距变量的相关分析:定距变量又称为间隔(interval)变量(即连续属性变量),变量值之间可以比较大小,可以用加减法计算出差异的大小。
表格的第一行(Euclidean距离)说明采用的是欧氏距离。
可是在现实世界中,变量间的关系往往并不是简单的确定性关系,也就是说,变量之间有着密切的关系,但又不能由一个或几个变量的值确定另一个变量的值,即当自变量x取某一???时,因变量y的值可能会有多个。
Spearman相关系数及Z统计量
Pearson相关性
偏相关分析的任务就是在研究两个变量之间的线性相关关系时控制可能对其产生影响的变量,这种相关系数称为偏相关系数。
当≤|r时视为中度相关;
当|r时说明变量之间的相关性很弱。
其中的距离又分为个案(观测记录)之间的距离和变量之间的距离两种。
偏相关分析的任务就是在研究两个变量之间的线性相关关系时控制可能对其产生影响的变量,这种相关系数称为偏相关系数。
既可以计算其相似性测度,亦可计算其不相似性测度;
【例7-4】已知我国四城市2004年各月的日照时数如下表所示,请分析各城市日照数是否近似。
相关系数的取值范围界于-1与1之间,即-1≤r≤1;检验的统计量为:;(4)SPSS实现举例
【例7-3】下表是四川绵阳地区3年生中山柏的数据,分析月生长量与月平均气温、月降雨量、月平均日照时数、月平均湿度4个气候因素中哪些因素有关。
;7.3偏相关分析;第4步主要结果及分析。;;(1)基本概念
距离分析是对观测量之间相似或不相似程度的一种测度,是计算一对观测量之间的广义距离。这些相似性或距离测度可以用于其他分析过程,例如因子分析、聚类分析或多维定标分析,有助于分析复杂的数据集。
(2)统计原理
不相似性测度
对定距数据的不相似性(距离)测度可以使用的统计量有:欧几里得距离、平方欧氏距离、切比雪夫距离、Block距离、明可斯基距离等。
对定序数据,主要使用卡方不相似测度和斐方测度。
对二值(只有两种取值)数据变量之间的距离描述,使用欧氏距离、平方欧氏距离、尺寸差异、模式差异、方差、形或兰斯和威廉斯等距离统计量。;相似性测度
对于定距数据主要使用皮尔逊相关系数和夹角余弦距离;
对于二值数据的相似性测度主要包括简单匹配系数、Jaccard相似性指数、Hamann相似性测度等20余种。
;(4)SPSS实现举例
【例7-4】已知我国四城市2004年各月的日照时数如下表所示,请分析各城市日照数是否近似。;【例7-4】已知我国四城市2004年各月的日照时数如下表所示,请分析各城市日照数是否近似。
故应拒绝原假设,说明中山柏的生长量与气温间存在显著的相关性。
其中的距离又分为个案(观测记录)之间的距离和变量之间的距离两种。
提出零假设H0:即两总体无显著的线性关系;
二元定距变量的相关分析:定距变量又称为间隔(interval)变量(即连续属性变量),变量值之间可以比较大小,可以用加减法计算出差异的大小。
4按相关程度分:不相关、低度相关、显著相关、高度相关和完全相关
距
您可能关注的文档
最近下载
- (完整版)电气设备安装标准规范.pdf
- GB∕T 13861-2022生产过程危险和有害因素分类、解读与示例说明清单【危险源识别工具】(雷泽佳-2024A0).doc
- 2021年中国光大银行校园招聘在线测试笔试题考试真题笔经.doc
- 新浪·按键精灵开发者1级认证参考解析.docx VIP
- 2023年福建省各地中考语文模拟卷【文学类文本阅读题解及答案解析】汇集.docx VIP
- 皮亚杰认知发展论.ppt VIP
- 2.1 几代中国人的美好夙愿 课件初中读本.ppt
- 流域化“厂网一体”运营模式的探索与实践.pdf
- 半导体制造技术离子注入工艺.pptx
- 全国普通话水平测试用普通话词语表(表一+表二).pdf
文档评论(0)