10__两变量关联性分析幻灯片.ppt

  1. 1、本文档共53页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
10__两变量关联性分析幻灯片

有关身高的统计趣味 19世纪英国的遗传学家高尔登通过对人体的遗传特征进行对比研究,发现个子高的父母其子女的个子也高,但平均来说却不比他们的双亲高;个子矮的父母其子女个子也矮。但平均来说却不比他们的双亲矮。高尔登的学生英国的遗传学家、统计学家皮尔逊又深入研究,把这种身材趋向人的平均身高现象称为“回归”,并作为统计概念加以推广。因此,在统计历史上,身高曾是最早的统计回归分析的一个重要内容。当然,如今身高也与统计有着千丝万缕的联系。 身高与财富的关系 后面我们会讲到,相关系数也称皮尔逊积矩相关系数,它是反映两个变量之间相相关密切程度的统计分析指标。相关系数通常用r表示,r的绝对值越大,相关程度越高。回归系数通常用b表示,b的绝对值越大,表示X对Y影响越大。   那么,如果进行大样本跟踪调查分析研究。可以发现:在有钱人中高个子的比率远远高于正常比值。即,身高与财富有密切的相关关系。这是一个很奇怪的正常现象。 以美国为例。美国公司的首席执行官位置大都被高个子占据,高个子控制着美国社会大部分财富。例如,在全美50家最大公司的CE0中,29%的男性身高在l90cm以上,而美国人口中只有2%的男性达到这个高度。此外,在美国《财富)排行榜上前500名GE0的平均身高为183cm,其中有30%的人身高超过188cm,这比美国男人平均身高高13 cm(约175 cm),其中58%的人身高超过6英尺(约183 cm),而这种身高的男性在美国总入口中仅占l 4.5%。而身高超过6英尺2英寸(约188 cm)的人数,占该排行榜的3 0%,这种身高其实仅占美国总入口的3.9%。由此可见,身高在财富分配中所占的优势十分明显。另据美国收入调查表明,在美国,高个子比矮个子每高1英寸(约2.54厘米),年收入就多789美元。此外,高个子还占据着上级领导的位置,身高统计发现;主教比牧师平均身高高,销售经理比推销员平均身高高,在律师、教师乃至铁路工人中都存在主管的平均身高高于下级这一规律。荷兰的调查也显示,管理阶层平均比蓝领阶层身高高1英寸。 另外身高与权力也有关系,特别需要说明一点的是,在美国总统竞选史上,几乎所有的高个子都战胜了矮个子(只有2000年大选是个例外,但获胜的小布什实际得票总数低于戈尔)。 文章其他部分可以去搜下“《有关身高的统计趣味》宫春子 辽宁省辽东学院” 第一节 直线相关 直线相关(linear correlation)又称为简单相关(simple correlation),用于研究两个连续性随机变量X和Y之间的线性关系。 为了直观地说明两相关变量的线性依存关系,用表10-1第(2)、(3)列中14名中年健康妇女的基础代谢(kj/d)与体重(KG)的数据在坐标纸上描点,得图11-1所示的散点图(scatter plot)。 相关的类型 ★正相关 ★负相关 ★完全正相关 ★完全负相关 ★称零相关 二、相关系数的意义及计算 样本的相关系数用r (correlation coefficient) 相关系数r的值在-1和1之间,但可以是此范围内的任何值。正相关时,r值在0和1之间,散点云图是斜向上的,这时一个变量增加,另一个变量也增加;负相关时,r值在-1和0之间,散点云图是斜向下的,此时一个变量增加,另一个变量将减少。r的绝对值越接近1,两变量的关联程度越强,r的绝对值越接近0,两变量的关联程度越弱。 计算例10-1的相关系数 第二节 秩相关 适用条件: 1、不服从双变量正态分布 2、总体分布型未知 3、原始数据用等级表示的资料 一、Spearman等级相关 基本思想:观察值 秩 相关系数 计算公式: 总体等级相关系数?s的检验 1、n≤50时,用查表法(附表14) 2、n50时, 1、假设: H0:?s=0 H1: ?s≠0 ?=0.05 2、计算检验统计量 对应奥美拉唑组样本观察值为64和21,构成一个频率分布; 对应雷尼替丁组样本观察值为51和33,构成一个频率分布; 问题:两个样本分布的总体分布是否相等,或两样本是否来自同一总体。 H0:两种药物治疗消化道溃疡的愈合率相同。 即相当于两样本分布的总体分布相等。总体分布未知,用两样本联合计算的频率分布作为总体分布的近似。 属性Y1的理论频率近似地等于m1/n 属性Y2的理论频率近似地等于m2/n 那么各个格子的理论频数分别为: 那么每个格子的理论频数分别为: 关联系数 案例分析(相关) 一、两组独立二分类资料的 2 ×2表关联性分析 合计 艾滋病知晓程度 大学生专业 500 450 50 合计 378 359 19 其它 122 91 31 医科专业 低 高 例1

文档评论(0)

wnqwwy20 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:7014141164000003

1亿VIP精品文档

相关文档