- 1、本文档共67页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第十章相关与回归的分析全
第十章 相关与回归的分析 主要内容: 各种不同变量的相关分析; 回归分析。 一、变量间的相互关系 (一)相关关系与因果关系 1、相关关系 (1)相关关系的含义:现象之间的数量关系存在着两种不同的类型:一种是函数关系,另一种是相关关系。 函数关系指的是变量之间存在着的严格的依存关系,它们之间的关系值是固定的,对于某一变量的每一个值,都有另一个变量的完全确定的值与之相对应。 例如,圆的面积等于圆周率乘以半径的平方。 (2)相关关系的特性 对相关关系的分析,主要是把握相关关系三个方面的特性: 其一,相关的强度。即两个变量相关关系的确定程度。 其二,相关的方向。 其三,线性相关与非线性相关。 (3)相关关系的种类 A、正相关与负相关 从相关的方向看,相关关系可以分为正相关和负相关。 三、定类变量间的相关关系判定及检验 在各个研究领域中,有些研究问题只能划分为不同性质的类别,各类别没有量的联系。例如,性别分男女,职业分为公务员、教师、工人、……,教师职称又分为教授、副教授、……。有时虽有量的关系,因研究需要将其按一定的标准分为不同的类别,例如,学习成绩、能力水平、态度等都是连续数据,只是研究者依一定标准将其划分为优良中差,喜欢与不喜欢等少数几个等级。要判别这些分类间是否有相关关系就得用到相应的方法。 (一)交互分类表 交互分类表又叫列联表和条件次数表。它是按两个变量的值将所研究的个案进行分类,亦即将两个变量的次数交互分配在一张统计表中成为一个矩阵,这种表就叫交互分类表。例如:某单位对职工的闲暇时间进行了调查,根据不同年龄档和喜爱的电视节目进行了如下的统计分类: 从交互分类表中可以清楚地看到在各个年龄层下收视倾向的不同的次数分布状况,因此这种表又叫条件次数表。表的最下端是每个年龄层的总次数,称为边缘次数,它们的分布叫边缘分布。表中的其他次数叫条件次数,表示在自变量的每一个值下因变量各个值出现的次数,其次数分布叫条件分布。 交互分类表有大小之分,我们一般用横行数目(r)乘上纵列数目(c)即rΧ c表示表的大小。 交互分类表还可做成相对频次分布表,如前表就可转化为下表:(这样的表更便于比较) 通过交互分类表我们可以初步的观察两个变量间是否相关。当然这种观察是粗略的,如果要较准确地检验就需进行卡方检验并计算相关系数。 年龄层与收视倾向(%) (二) X2 (卡方)检验 X2是对样本的频数分布所来自的总体分布是否服从某种理论分布或某种假设分布所作的假设检验。它与前面所讲的抽样数据的假设检验的不同在于:第一,前者数据属于定距或定比变量(如果是定类变量它也是是非标志);第二,测量数据所来自的总体要求呈正态分布,而X2检验的数据来自的分布是未知的;第三,测量数据的假设检验是对总体参数的假设检验, X2检验是对总体分布的假设检验。因此,它是属于自由分布的非参数检验。 X2的基本公式是: X2 = ∑(f0-fe)/ fe (表示f0实际频数, fe表示理论频数) 对两变量进行X2检验的步骤是: 第一步:建立两变量不存在相关关系的虚无假设和与之对立的备择假设。 第二步:按照X2公式计算X2 。 第三步:根据公式df=(r-1)(c-1)计算出来的自由度和选定的显著性水平,查出X2的临界值。 第四步:作出统计决策。 卡方检验是由统计学家皮尔逊推导的。理论证明,实际观察次数(fo)与理论次数(fe)(又称期望次数)之差的平方再除以理论次数所得的统计量,近似服从卡方分布,当fe越大(fe≥5),近似得越好。显然fo与fe相差越大,卡方值就越大;fo与fe相差越小,卡方值就越小;因此它能够用来表示fo与fe相差的程度。 下面举例说明几种常用的卡方检验: 检验无差假设 所谓无差假设,是指各项分类的实际数之间没有差异,也就是说各项分类之间的概率相等,因此理论次数完全按概率相等的条件来计算。即任一项的理论次数都等于总数/分类项数。因此自由度也就等于分类项数减1。 例1 随机地将麻将色子抛掷300次,检验该色子的六个面是否均匀。结果1-6点向上的次数依次是,43,49,56,45,66,41。 解:每个类的理论次数是 300/6 = 50,代入公式: X2=(43-50)2/50+(49-50)2/50+……=8.96 在0.05的显著性水平下自由度为5情况下X2的临界值是11.1。 因此,在0.05的显著性水平下,可以说这个色子的六面是均匀的。 检验假设分布的概率 这里的假设分布可以是经验性的,也可以是某理论分布。公式中所需的理论次数则按照这里假设的分布进行计算。 例2 国际色觉障碍讨论会宣布,每12个男子中,有一个是先天性色盲。从某校抽取的132名男生中有4人是色盲,问该校男子色盲比率与上述比例是否有显著差异? 解:按国际色觉障碍讨论会的统计结果
文档评论(0)