- 1、本文档共59页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第四章 基本统计分析 描述性统计分析(Descriptive Statistics) 1. Frequencies 频数分析 2. Descriptive 描述性统计分析 3. Explore 探索分析 4. Crosstabs 列联表分析 5. Ratio 比率分析 二、频数分析 (一)频数的定义 频数就是一个变量在各个变量值上取值的个案数,是描述性统计中最常用的方法。 可编制频数分布表和绘制统计图,把握数据分布的基本特征。 频数分析 (二)频数分析的目的 通过频数分析能够了解变量取值的状况,对把握数据的分布特征是非常有用的。 频数分析 (三)频数分析的功能 1.产生详细的频数表; 2.按要求给出某个分位点; 3.绘制常用的条图、饼图、直方图。 适用范围:更适用于对分类变量以及不服从正态分布的连续性变量进行描述。 统计量 条形图 用宽度相同的条形的高度或长短来表示频数分布变化的图形,适用于定类和定序变量的分析。 条形图 饼图 用圆形及圆内扇形的面积来表示频数百分比变化的图形,有利于研究事物内在结构组成等问题。饼图中圆内扇形的面积可以表示频数,也可以表示百分比。 饼图(圆饼图) 直方图 用矩形的面积来表示频数分布变化的图形,适用于定距型变量的分析。 直方图 频数分析的应用举例 案例: 利用住房状况问卷调查数据,分析被调查家庭中户主的从业状况和目前所住房屋的产权情况。 频数分析的操作步骤 结论 由从业状况表得到的分析结论如下:本次被调查家庭的总数为2993户,户主的从业状况是:人数最多的是国有企业,其次是行政事业单位和私营企业,人数最少的是大专院校科研单位。 由房屋产权表得出:近50%是多层商品房,无产权和部分产权也占有一定比例,二手房的比例较低,高层商品房的比例最少。 频数分析的扩展功能 举例 应用住房状况调查问卷数据,分析人均住房面积的分布情况,并对本地户口和外地户口家庭进行比较。 分析思路 由于人均住房面积为定距型变量,直接采用频数分析不利于其分布形态的把握,因此考虑,依据我们上节课中学过的分组功能对数据分组后再编制频数分布表。频数分布表如下: 分组后人均面积 接下来利用频数分析计算出所有样本的人均住房面积的四分位数,然后,按照户口状况对数据进行拆分,并重新计算四分位数,分别得到本市户口和外地户口的人均住房面积的四分位数。结果如下: 表1 表2 表1表明:25%家庭的人均住房面积在13.7平方米以下;有50%家庭的人均住房面积在19.6平米以下。 表2表明:本市户口家庭2825户,人均住房四分位数差是13;外地户口家庭168户,人均住房面积的四分位数差是21.6.可见外地户口家庭的人均住房面积的离散程度高于本市户口,尤其在高数值区。 三、计算基本描述统计量 (二)基本描述统计量 常见的基本描述统计量可以分为三大类: 1、集中趋势的描述统计量(均值、中位值、众值); 2、离散程度的描述统计量(标准差、方差、极差); 3、分布形态的描述统计量(偏度系数、峰度系数)。 (三)应用举例 利用住房状况调查问卷数据,对人均住房面积计算基本描述统计量,并分别对本市户口和外地户口家庭进行比较。(首先进行数据拆分) 统计结果表明:本市户口家庭的人均住房面积的均值是21.7平方米,低于外地户口家庭26.7。无论是本市户口还是外地户口,人均住房面积的分布均呈一定的右偏分布(两个偏度统计量分别为2.18和1.43),且本市户口的偏度更大些;同时,本市户口和外地户口家庭人均住房面积均呈尖峰分布(两个峰度统计量分别为8.3和2.1)。由此可见,本市户口和外地户口中的大部分家庭的人均住房面积都低于各自的平均水平,此时,仅用均值刻画住房状况是不准确的。 利用住房状况调查问卷数据,分析人均住房面积是否存在不均衡现象。 (分析人均住房面积是否存在不均衡现象,可以从分析住房面积是否有大量异常值入手。) (四)例题分析 已知20个初生婴儿的体重数据如下表,对其进行描述统计。 茎叶图 从左到右分为三部分:频数、茎和叶。 茎是整数部分,叶是小数部分,Stem width表示茎宽。每行的茎和叶组成的数字再乘以茎宽,即得到实际数据的近似值,实际数据中与该近似值靠近的值的个数即为频数表示的个数。 箱式图 方形是箱式图的主体,上下边为四分位数,中心粗线为中位数,变量的50%的观测值落在这一区域中。 方形上下两条
您可能关注的文档
最近下载
- Unit 6 Understanding ideas Longji Rice Terraces 课件-高中英语外研版(2019)必修第一册.pptx VIP
- 护理学导论(高职)教学教案.docx
- 2024年部编新改版语文六年级上册全册月考试题含答案(共4套).docx
- 饮用水和环境卫生公众健康宣教及风险沟通答案-2024年全国疾控系统“大学习”活动.docx VIP
- 新型冠状病毒、甲型和乙型流感病毒全预混冻干多重荧光PCR检测试剂盒及其检测方法发明专利.pdf VIP
- 基金会捐赠协议.doc VIP
- XX市智慧安居工程(一期)报警求助综合受理指挥分系详细设计方案.doc VIP
- 《乡土中国》 第11篇 《长老统治》.ppt
- [知识]职业生涯人物访谈(教师).pdf VIP
- 第六单元整本书阅读《西游记》课件 2024—2025学年统编版语文七年级上册.pptx VIP
文档评论(0)