- 1、本文档被系统程序自动判定探测到侵权嫌疑,本站暂时做下架处理。
- 2、如果您确认为侵权,可联系本站左侧在线QQ客服请求删除。我们会保证在24小时内做出处理,应急电话:400-050-0827。
- 3、此文档由网友上传,因疑似侵权的原因,本站不提供该文档下载,只提供部分内容试读。如果您是出版社/作者,看到后可认领文档,您也可以联系本站进行批量认领。
查看更多
SPSS教程-聚类分析-附实例操作.pdf
各地区各行业工资水平的分析 (2009年数据)
小组成员:张艺伟、赵月、陈媛、邹莉、朱海龙、曾磊、胡瑛、候银萍
1. 研究背景及意义
1.1 研究背景
工资水平是指一定区域和一定时间内劳动者平均收入的高低程度。生产决定分配,只有经济发
展才能提供更多的可分配的社会产品,因此一个地区的工资水平在一定程度上反映了其经济发展的
水平。
1.2 研究意义
1. 通过多元统计分析方法,探究一个地区的工资水平与其经济发展水平之间的内在联系。
2. 将平均工资水平划分为3 类,分析哪些地区、哪些行业的工资水平较高,可以为大学生就业提供
宏观上的方向指引。
2. 数据来源与描述
2.1 数据来源—— 《中国劳动统计年鉴─2010》
(URL:/Navi/YearBook.aspx?id=N2011010069floor=1### )
主编单位:国家统计局人口和就业统计司,人力资源和社会保障部规划财务司
出版社:中国统计出版社
简介:《中国劳动统计年鉴─2010》是一部全面反映中华人民共和国劳动经济情况的资料性年刊。
本刊收集了2009年全国和各省、自治区、直辖市、香港特别行政区、澳门特别行政区的有关劳动统
计数据。本书资料的取得形式主要有国家和部门的报表统计、行政记录和抽样调查。
2.2 数据描述
本数据集记录了全国31个省市(港、澳、台除外)的工资状况,各省市分别记录了其23个主要
行业的平均工资水平,这23个主要行业包括:企业、事业、机关、金融业、制造业、建筑业、房地
产业、农林牧渔业等等,具体数据格式参见图-0。
图-0
3. 分析方法及原理
3.1 通过描述统计分析方法,判断哪些行业平均工资水平较高
描述统计分析方法主要是从基本统计量(诸如均值、方差、标准差、极大/小值、偏度、峰度等)
的计算和描述开始的,并辅助于SPSS 提供的图形功能,能够把握数据的基本特征和整体的分布特征。
在本案例中,通过比较不同行业(诸如企业、事业、机关、建筑业、制造业„„)工资的均值、
极大/小值,可以从总体上判断哪些行业的平均工资水平较高,哪些行业的较低。
3.2 通过聚类分析方法,判断哪些地区平均工资水平较高
聚类分析是依据研究对象的个体特征,对其进行分类的方法,分类在经济、管理、社会学、医
学等领域,都有广泛的应用。聚类分析能够将一批样本(或变量)数据根据其诸多特征,按照在性
质上的亲疏程度在没有先验知识的情况下进行自动分类,产生多个分类结果。类内部个体特征之间
具有相似性,不同类间个体特征的差异性较大。
在本案例中,我们将采用两种方法进行聚类分析:一种是系统聚类法,另一种是 K-均值法(快
速聚类法)。
3.2.1 系统聚类法
系统聚类法的基本原理:首先将一定数量的样本或指标各自看成一类,然后根据样本(或指标)
的亲疏程度,将亲疏程度最高的两类进行合并,然后考虑合并后的类与其他类之间的亲疏程度,再
进行合并。重复这一过程,直到将所有的样本 (或指标)合并为一类。
系统聚类分为Q 型聚类和R 型聚类两种:Q 型聚类是对样本进行聚类,它使具有相似特征的样
本聚集在一起,使差异性大的样本分离开来;R 型聚类是对变量进行聚类,它使差异性大的变量分
离开来,相似的变量聚集在一起,这样就可以在相似变量中选择少数具有代表性的变量参与其他分
析,实现减少变量个数、降低变量维度的目的。
在本例中进行的是Q 型聚类。
类与类之间距离的计算方法主要有以下几种:
(1) 最短距离法 (Nearest Neighbor),是指两类之间每个个体距离的最小值;
(2 ) 最长距离法(Farthest Neighbor),是指两类之间每个个体距离的最大值;
(3 ) 组间联接法(Between-groups Linkage ),是指两类之间个体之间距离的平均值;
(4 ) 组内联接(Within-groups Linkage ),是指把两类所有个体之间的距离都考虑在内;
(5 ) 重心距离法(Centroid clustering ),是指两个类中心点之间的距离;
(6 ) 离差平方和法(Ward 法),同类样品的离差平方和应当较小,类与类之间的离差平方和应当
较大。
3.2.2 K-均值法(快速聚类法)
K-均值法(又称快速聚类法),是由MacQueen 于1967 年提出的,它将数据看成K 维空间上的
点,以距
您可能关注的文档
- Proceq profometer5+钢筋扫描仪使用手册.pdf
- PsycINFO心理学文摘数据库中的护理资源.PDF
- PTCASIA展商信息征集.PDF
- Python3 错误和异常.pdf
- QFII扩容力助A股平稳运行.PDF
- QFTerm3–ASA泉发花园校区第三期课外活动课.PDF
- QJB潜水搅拌机.pdf
- Q/SHS 0001.2-2001 油田企业HSE管理规范.pdf
- Ruking伺服在六关节机械手上的应用.PDF
- RWE开发和部署天然气及电力交易和风险管理的自动化系统.PDF
- 2024高考物理一轮复习规范演练7共点力的平衡含解析新人教版.doc
- 高中语文第5课苏轼词两首学案3新人教版必修4.doc
- 2024_2025学年高中英语课时分层作业9Unit3LifeinthefutureSectionⅢⅣ含解析新人教版必修5.doc
- 2024_2025学年新教材高中英语模块素养检测含解析译林版必修第一册.doc
- 2024_2025学年新教材高中英语单元综合检测5含解析外研版选择性必修第一册.doc
- 2024高考政治一轮复习第1单元生活与消费第三课多彩的消费练习含解析新人教版必修1.doc
- 2024_2025学年新教材高中英语WELCOMEUNITSectionⅡReadingandThi.doc
- 2024_2025学年高中历史专题九当今世界政治格局的多极化趋势测评含解析人民版必修1.docx
- 2024高考生物一轮复习第9单元生物与环境第29讲生态系统的结构和功能教案.docx
- 2024_2025学年新教材高中英语UNIT5LANGUAGESAROUNDTHEWORLDSect.doc
文档评论(0)