- 1、本文档共49页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
统计学第六章 研究变量的关系:相关与回归.pdf
第六章
研究变量之间的关系:相关与回归
以前各章的描述统计和推断统计集中在单
变量上,这是统计的基础。两个或多个变量
之间关系的研究是大部分研究的核心,是统
计应用的重点。多变量统计分析建立在单变
量分析工具上,指导原则是相同的:
作图表现数据,给出数值概括度量
寻找整体模式,讨论与模式的偏差
当整体模式比较规律,用一个简洁的数学
模型描述。
第一节分类数据之间关系研究:列联表
• 许多变量本身是分类变量,如性别、种族
和职业,其他分类变量由将数值变量的取
值分成若干个组而产生的。为了分析分类
变量的关系,需要使用落在各个类别中的
频数或频率,列联表(two-way table )是
概括分类数据关系的一种分析工具。
• 列联表结构:行变量、列变量、行和、列
和频数
第一节分类数据之间关系研究:列联表
• 例CASE7.1 音乐会影响购买行为吗?
列联表的分析开始于对单个变量分布的观察,即
边际分布。Stata命令:tabulate Wine Music [fweight
= count]
第一节分类数据之间关系研究:列联表
• 分类变量间的关系可由条件分布的比较来描述:
CASE7.1 条件分布的比较:
第一节分类数据之间关系研究:列联表
• Simpson 悖论:
An association or comparison that holds for all of several
groups can reverse direction when the data are
combined to form a single group. This reversal is called
Simpson’s paradox.
启发:Conclusions that seem obvious when we look only
at aggregated data can become quite different when the
data are examined in more detail.
第一节分类数据之间关系研究:列联表
Example:
第一节分类数据之间关系研究:列联表
• 统计检验:
The null hypothesis H0 of interest in a two-way table is
there is no association between the row variable and the
column variable.
The alternative hypothesis Ha is that there is an
association between these two variables. The alternative
Ha does not specify any particular direction for the
association. For r ×c tables in general, the alternative
includes many different possibilities. Because it includes
all the many kinds of association that are possible, we
cannot describe Ha as either one-sided or two-sided.
第一节分类数据之间关系研究:列联表
• 检验方法:To test the null hypothesis in r ×c tables,
we compare the observed cell counts with expected cell
counts calculated under the assumption that the null
hypothesis is true. Our test statistic is a numerical
measure of the distance between the observed and
expected cell counts.
第一节分类数据之间关系研究:列联表
• Chi方检验:
第一节分类数据之间关系研究:列联表
卡方检验:
您可能关注的文档
- 第二代DCS1800选带直放站使用说明书09(广东)C.pdf
- 第五节松弛法.ppt
- 第五讲:动态系统建模、仿真与控制综合应用2011.pdf
- 第四章第一节第一部分.ppt
- 系统参数辨识+matlab+实现.doc
- 系统变量().pdf
- 紫坪铺枢纽工程煤系地层帷幕灌浆实践.pdf
- 组合评价法在综合交通枢纽客运站布局评价中的应用.pdf
- 结构力学等效结点荷载.ppt
- 综合单价分析表示例.pdf
- 中国国家标准 GB/T 22517.2-2024体育场地使用要求及检验方法 第2部分:游泳场地.pdf
- GB/T 22517.2-2024体育场地使用要求及检验方法 第2部分:游泳场地.pdf
- 《GB/T 22517.2-2024体育场地使用要求及检验方法 第2部分:游泳场地》.pdf
- 苏教版(2017秋)科学三年级下册1.《种子发芽了》 教案(含课堂练习和反思).docx
- 2024-2025学年小学数学六年级上册冀教版(2024)教学设计合集.docx
- 地理商务星球版七年级上册4.5形成气候的主要因素 同步教案.docx
- 2024-2025学年中职中职专业课金融类73 财经商贸大类教学设计合集.docx
- 2024-2025学年初中地理七年级上册(2024)仁爱科普版(2024)教学设计合集.docx
- 2024-2025学年小学英语二年级上册外研版(一起)教学设计合集.docx
- 2024-2025学年高中数学选择性必修 第二册北师大版(2019)教学设计合集.docx
文档评论(0)