[终稿]多元统计课程设计.doc

  1. 1、本文档共27页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
[终稿]多元统计课程设计

成 绩 评 定 表 学生姓名 焦亚庆 班级学号 1109030111 专 业 统计学 课程设计题目 各行业指标的聚类分析 评 语 组长签字: 成绩 日期 20 年 月 日 课程设计任务书 学 院 理学院 专 业 统计学 学生姓名 焦亚庆 班级学号 1109030111 课程设计题目 各行业指标的聚类分析 实践教学要求与任务: 通过该课程设计,使学生进一步理解多元统计分析的基本概念、理论和方法;初步掌握SPSS统计软件作常见的多元统计检验和多元统计分析;掌握典型的多元统计分析方法,使教材中的理论能应用到实践。 1.数据整理:收集数据,录入数据。 2.分类模型:判别分析中距离判别法、费希尔判别法、贝叶斯判别法的应用,以最优的性质对P维空间构造一个“划分”,给出判别函数,判断新样品的归属。聚类分析中系统聚类法、K均值聚类法的应用,对样品或变量进行量化分类。 3.降维模型:主成分分析在保留原数据的大部分信息的基础上,提取较少的主成分代替较多的变量,克服多变量中信息重叠,降低数据维数。因子分析中提取因子载荷阵,得到表示原始变量基本数据结构的公共因子,简化数据。 4.各模型结果的分析解释,并应用于实际问题。 工作计划与进度安排: 周四5~8节:选题,设计解决问题方法 周五5~8节:SPSS应用,完成论文,答辩 指导教师: 201 年 月 日 专业负责人: 201 年 月 日 学院教学副院长: 201 年 月 日 摘 要 聚类分析在应用多元统计分析中是很重要的一部分,是根据研究对象的特征按照一定标准对研究对象进行分类的一种分析方法,它使组内的数据对象具有最高的相似度,而组间具有较大的差异。聚类分析可以在没有先验分类的情况下通过观察对数据进行分类,在科学研究和实际的生产实践中都具有广泛的应用,SPSS的分类过程可以使用用户方便地实现聚类分析。聚类分析有很多种方法,常见的主要有系统聚类法、K-均值聚类法、二阶聚类法等等。通过对聚类分析的学习,可以将实际问题转化为应用多元统计分析的具体问题,运用聚类分析的知识,熟练运用聚类分析软件命令,利用SPSS实现对问题的分类和解读,达到分类的真实效果。 本文运用了系统聚类和K均值聚类的方法,将2007年我国各行业的情况进行聚类分类,且在分类中充分考虑各指标间的关系,使分类达到了很好的效果。通过SPSS对取得的数据进行分析,可以将各行业的情况情况分成6到8类,鲜明形象的体现了聚类分析的优势。 关键词 聚类分析 系统聚类 K-均值聚类 SPSS 目 录TOC \o 1-2 \h \u HYPERLINK H:\\应用多元统计分析\\应用多元统计分析康阳.docx \l _Toc375155926 一 设计目的 1 HYPERLINK H:\\应用多元统计分析\\应用多元统计分析康阳.docx \l _Toc375155928 二 问题描述 1 HYPERLINK H:\\应用多元统计分析\\应用多元统计分析康阳.docx \l _Toc375155929 三 问题解决 3 HYPERLINK H:\\应用多元统计分析\\应用多元统计分析康阳.docx \l _Toc375155937 四 结果比较 16 总 结.........................................................17 参考文献......................................................18 一 设计目的 了解聚类分析,学会应用SPSS软件进行不同方法的聚类分析。同时更好的了解应用多元统计分析的知识,熟练掌握聚类分析在实际问题上的应用,并将所学的知识结合SPSS对数据的处理解决实际问题。本设计是利用SPSS软件对2007年我国各行业的情况进行聚类分类。 二 问题描述 下表给出了2007年我国各行业的工业总产值、工业增加值、资产总计、流动资产总计、流动资产年平均余额、负债合计、流动负债合计、主营业务收入、主营业务成本、利润总额,试对下表进行聚类分类,以了解2007年我国各行业的情况。 行 业 工业总产值 工业增加值 资产总计 流动资产总计 流动资产年平均余额 负债合计 流动负债合计 主营业务收入 主营业务成本 利润总额 煤炭开采和洗选业 1556.92 681.63 954.72 437.82 410.63 472.19 399.29 1538.09 1133.39 149.15 石油和天然气开采业 13.64 6.03 14.85 4.73 4.12 6.41 6.36 13.04 9.91 1.44 黑色金属矿采选业 1149.52 4

文档评论(0)

beoes + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档