社会调查方法——统计与.ppt

  1. 1、本文档共44页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第十章 资料的统计分析 相关分析的统计工具 散点图 相关系数r r 的取值范围在[-1,1];r=0表示不相关 0|r|0.3,低度相关;0.3|r|0.7,中度相关; 0.7|r|1,高度相关 SPSS之Correlate命令分析(例题) 通过相关分析可以知道两个变量之间相关关系的程度和方向。这时我们就可以通过一个已知变量的情况去预测另一个未知变量的情况,而这种通过已知变量预测未知变量,找出变量间的依存(数量)关系, 用函数关系式表达出来的分析方法被称为回归分析。 “回归”的来由: “回归”的概念是1877年英国生物学家高尔顿首先提出。 高尔顿在研究父母身高与子女身高关系时发现身材高的父母所生的子女的身材一般要高些,但不是最高;身材矮的父母所生子女的身材一般也矮些,但不是最矮。而且子女的身高趋于父母的平均身高,高尔顿把这种现象称为回归。 回归分析的方法 散点图分析 (例题) 建立回归方程,进行预测。 单相关:一元回归方程 Y=a+bX (线性、曲线) 复相关:多元回归方程 Y=a+b1X1+b2X2+b3X3 回归的含义: 回归(Regression,或Linear Regression)和相关同样都用来分析两个定距变量间的关系,但回归有明确的因果关系假设。即要假设一个变量为自变量,一个为因变量,自变量对因变量的影响就用回归表示。如年龄对收入的影响。由于回归构建了变量间因果关系的数学表达,它具有统计预测功能。 回归的统计原理: 两个定距变量的回归是用函数 y= f(x) 来分析的。我们最常用的是一元回归方程 在统计学中,这一方程中的系数是靠x与y变量的大量数据拟合出来的。 比如通过上学年数和工资的关系计算得出下列的回归公式: y=472+14.8x 就可知上学年数每增长1年,工资会增加14.8元; 也可推测,上学年数为15年的人,工资收入应为472 + 14.8 *15=694元。 【例题】 假定对10名工人进行调查(结果见下表),试计算工人的年龄与他们收入之间的函数关系。 10 8 7 6 5 4 3 2 1 序号 260 33 420 54 400 44 360 50 380 37 300 28 350 41 300 32 280 25 收入(元/月) 年龄(岁) y=156.923+4.761x 回归分析研究的是自变量与因变量之间的非确定性的因果关系; SPSS提供的回归分析过程有: 线性回归(Linear)、曲线估计(Curve Estimation)、二分变量逻辑回归 (Binary Logistic)、多分变量逻辑回归(Multinomial Logistic)、序回归(Ordinal)、概率单位回归(Probit)、非线性回归(Nonlinear)、加权估计(Weight Estimation)、最优编码回归(optimal Scaling)和二阶段最小平方法(2-Stage Least Squares )。 其中x为自变量;y为因变量;a为截距,即常量;b为回归系数,表明自变量对因变量的影响程度。 X Y Y=a+bx (x,y) 由图中可以看出,回归直线应该是到所有数据点最短距离的直线。该直线的求得即使用“最小二乘方法”,使: 在拟合的回归直线方程中,回归系数: 表示x每变化一个单位时,x与y共同变化的程度(共变异数)。 常数 浙江工业大学 浙江工业大学 * 1、频数分布 一组数据中取不同值的个案的绝对次数分布情况。 2、频率分布 一组数据中不同取值的频数相对于总数的比率分布情况。通常以百分比的形式表达。 20 合计 2 农民 5 商人 3 教师 6 干部 4 工人 人数(个) 职业类别 表9-1 某班学生父亲的职业分布 100 合计 10 农民 25 商人 15 教师 30 干部 20 工人 百分比( % ) 职业类别 表9-2 某班学生父亲职业分布 一、描述性统计分析 3、集中趋势分析 集中趋势分析指的是用一个典型值或代表值来反映一组数据的一般水平,或者说反映这组数据向这个典型值集中的情况。 ①平均数(Mean): ②众数(Mode):众数是一组数据中出现次数最多(即频率最高)的那个数值。 ③中位数(Median):把一组数据按值的大小顺序排列起来,处于中央位置的那个数值就叫中位数。 4、离散趋势分析 5、如何利用SPSS生成频数/频率表 实例:对变量 “文化程度” 进行频数统计。 操作步骤:单击Analyze→Descriptive Statistics→Frequencies…,此时会出现Frequencies对话框: 将变量“文化程度”从对话框左边的变量列表选入右边的方框内→点击OK

文档评论(0)

希望之星 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档