第五章描述性统计分析.ppt

  1. 1、本文档共43页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第五章描述性统计分析课件

【例5-5】下面我们具体说明这三个命令的使用,这里仍然使用wage.dta数据集。 (1)对wage尝试表5.11中的各种转换 (2)尝试命令gladder以及分位—正态图的幂阶梯版本qladder,通过这两个命令可以非常轻松地比较每种转换的直方图和正态分布曲线。 5.5相关系数 一般来说,变量之间的关系可以分为两类: 一类是确定性的关系,即通常的函数关系,另一类是非确定性的关系,即相关关系,例如身高和体重的关系,身高不同的人体重有差异,但是身高相同的人,体重又不一样,这说明身高和体重并不存在确定的函数关系。相关分析的主要目的是研究变量之间关系的密切程度。 回归方程的斜率系数在一定程度上也是反映两个变量之间关系的 密切程度,斜率系数的平方根就是相关系数,所以在进行回归分析之前,进行相关分析有一定的意义。 5.5相关系数 常用的相关系数共有如下四种:Pearson相关系数、.Kendall τ相关系数、Spearman秩相关系数以及偏相关系数。 1.皮尔森相关系数(Pearson correlation coefficient)也称皮尔森积矩相关系数(Pearson product-moment correlation coefficient) ,是一种线性相关系数。皮尔森相关系数是用来反映两个变量线性相关程度的统计量。 r描述的是两个变量间线性相关强弱的程度。r的绝对值越大表明相关性越强。 值域等级解释 相关系数的绝对值越大,相关性越强:相关系数越接近于1或-1,相关度越强,相关系数越接近于0,相关度越弱。 通常情况下通过以下取值范围判断变量的相关强度: 相关系数 0.8-1.0 极强相关 0.6-0.8 强相关 0.4-0.6 中等程度相关 0.2-0.4 弱相关 0.0-0.2 极弱相关或无相关 侧 Stata的相关系数命令不仅可以得到通常的相关系数,还可以计算协方差矩阵,更为有用的是它还提供了对缺失值的不同处理方法。 Pearson相关系数 correlate [varlist] [if] [in] [weight] [, correlate_options] pwcorr [varlist] [if] [in] [weight] [, pwcorr_options] Correlate命令计算变量之间的Pearson相关系数或者协方差矩阵,如果不指定变量,则默认对数据集中的所有变量计算相应的矩阵。Pwcorr命令的好处是尽可能使用两两变量中所有没有缺失的数据;而不像correlate只采用没有任何缺失数据的完整的观测值。 【例5-6】使用数据集wage.dta,完成如下任务: (1)得到的wage、educ、exper、tenure之间的相关系数矩阵, Correlate wage educ exper tenure (2)得到的wage、educ、exper、tenure之间的协方差矩阵, Correlate wage educ exper tenure,covariance (3)sig选项给每一个相关系数做显著性检验,这个检验的原假设是总体相关系数是0,在每一个相关系数下方标明了检验的p值。star(.05)是为显著性超过0.05的相关系数打上星号,print(.05)则是仅显示这些显著的相关系数,在下面的命令中我们添加这三个选项 Pwcorr wage educ exper tenure,sig star(.05) print(.05) (4)相关系数数字背后的图形直觉可以用graph matrix来方便的实现 Graph matrix wage educ exper tenure 2. spearman(斯伯曼/斯皮尔曼)相关系数 在统计学中,斯皮尔曼等级相关系数以Charles Spearman命名,并经常用希腊字母ρ(rho)表示其值。斯皮尔曼等级相关系数用来估计两个变量X、Y之间的相关性,其中变量间的相关性可以使用单调函数来描述。如果两个变量取值的两个集合中均不存在相同的两个元素,那么,当其中一个变量可以表示为另一个变量的很好的单调函数时(即两个变量的变化趋势相同),两个变量之间的ρ可以达到+1或-1。 假设两个随机变量分别为X、Y(也可以看做两个集合),它们的元素个数均为N,两个随即变量取的第i(1=i=N)个值分别用Xi、Yi表示。对X、Y进行排序(同时为升序或降序),得到两个元素排行集合x、y,其中元素xi、yi分别为Xi在X中的排行以及Yi在Y中的排行。将集合x、y中的元素对应相减得到一个排行差分集合d,其中di=xi-yi,1=i=N。随机变量X、Y之间的斯皮尔曼等级相关系数可以由x、y或者d计算得到 使用wage.dta数据集计算wage、educ、exper、tenure之间的

文档评论(0)

jiayou10 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:8133070117000003

1亿VIP精品文档

相关文档