北航数理统计大作业2-聚类与判别分析概要.doc

北航数理统计大作业2-聚类与判别分析概要.doc

  1. 1、本文档共22页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
北航数理统计大作业2-聚类与判别分析概要

应用数理统计作业二 学号: 姓名: 电话: 二〇一四年十二月 对NBA球队的聚类分析和判别分析 摘要利用spss软件关键词:1. 引言 3 2、相关统计基础理论 5 2.1、聚类分析 5 2.2,判别分析 6 3.聚类分析 7 3.1数据文件 7 3.2聚类分析过程 8 3.3 聚类结果分析 11 4、判别分析 12 4.1 判别分析过程 12 4.2判别检验 17 5、结论 20 参考文献 21 致谢 22 1. 引言 1896年,美国第一个篮球组织全国篮球联盟(简称NBL)成立,但当时篮球规则还不完善,组织机构也不健全,经过几个赛季后,该组织就名存实亡了) NBA季前赛是 NBA各支队伍的热身赛,因为在每个赛季结束后,每支球队在阵容上都有相当大的变化,为了让各队磨合阵容,熟悉各自球队的打法,确定各队新赛季的比赛阵 容、同时也能增进队员、教练员之间的沟通,所以在每个赛季开始之前,NBA就举办若干场季前赛,使他们能以比较好的状态投入到漫长的常规赛的比赛当中。为 了扩大NBA在全球的影响,季前赛有约三分之一的球队在美国以外的国家举办从总体上看,NBA的赛程安排分为常规赛、季后赛和总决赛。常规赛采用主客场制,季后赛和总决赛采用七场四胜制的淘汰制。[31]? NBA常规赛从每年的11月的第一个星期二开罗,到次年的4月20日左右结束。在这期间,30支球队总共要进行1189场常规赛,每支球队要打满82场比赛,主客场各占一半。季后赛从4月下旬开始进行,直到6月中旬决出总冠军为止。 NBA分为东西两个联盟,每个联盟各有三个赛区。在常规赛中每支球队与同一赛区的球队要打四场,与同一联盟不同赛区的球队打三到四场,与另一联盟的球队打两场。一个赛季每支球队在自己的主场至少与其它29支球队进行一次交锋。 常规赛的赛程比较紧凑,球队在每个星期有三到四场比赛,而且每个赛季都有不同程度的“背靠背作赛”、连续客场作赛等 难度赛程。在常规赛中,有两个日子的比赛是NBA联盟经过精心安排的,那就是第一天的揭幕战和圣诞节的圣诞大战。在这两个特殊的日子里,联盟往往会刻意安 排最具人气的球星之间进行对垒,以最大限度地吸引观众的眼球。 NBA 全明星赛是一项表演性的赛事,最初提出这个创意是的当时的NBA总部公关部负责人哈斯克·科恩的,而创意则源自于全美职业棒球联赛全明星赛,目的自然是为 了进一步宣传NBA。1951年波士顿成为了首届赛事的举办城市,当时的全明星赛只有全明星对抗赛一项活动。第一届扣篮大赛始于1984年丹佛全明星赛。 1986年达拉斯全明星赛,三分远投大赛产生。1994年明尼亚波利斯全明星赛,新秀挑战赛首次加入。技巧挑战赛开始于2003年。2004年全明星赛有 了混合投篮赛NBA 季后赛(NBA Playoffs)在每年4月下旬开始,东西部各有八支球队获得季后赛资格。东西两个联盟中各个赛区的冠军加上成绩最好的赛区的第二名组成前四号种子,这 四支球队再按照常规赛的成绩依次排为一到四号种子。剩余四支球队则按成绩依次排为五到八号种子。季后赛采用七场四胜制,采用2-2-1-1-1的主场分配 方法,拥有四个主场的一方将会在第一、二、五(如果需要)、七(如果需要)场比赛坐镇主场,第三、四、六(如果需要)场则是征战客场。对阵双方的主场优势 并非均衡。季后赛包括总决赛一共有四轮,第二轮叫分区半决赛,第三轮叫分区决赛,获胜球队称为分区冠军,东西部分区冠军晋级总决赛,七局四胜者为当赛季总冠军,总冠军球队中表现最优秀的球员获得总决赛MVP荣誉。聚类分析指将物理或抽象对象的集合分组成为由类似的对象组成的多个类分析过程。聚类分析的目标就是在相似的基础上收集数据来分类。从统计学的观点看,聚类分析是通过数据建模简化数据的一种方法。传统的统计聚类分析方法包括系统聚类法、分解法、加入法、动态聚类法、有序样品聚类、有重叠聚类和模糊聚类等。采用k-均值、k-中心点等算法的聚类分析工具已被加入到许多著名的统计分析软件包中,如SPSS、SAS等SPSS对所收集的数据进行快速聚类,其特点是:在确定类别数量基础上,先给定一个粗糙的初始分类,然后按照某种原则进行反复修改,直至分类较为合理。在选定类中心作为凝聚点的基础上进行分类和修正的方法有很多,本文使用的是K-Means 算法。 K-Means 算法接受输入量 k ;然后将n个数据对象划分为 k个聚类以便使得所获得的聚类满足:同一聚类中的对象相似度较高;而不同聚类中的对象相似度较小。聚类相似度是利用各聚类中对象的均值所获得一个“中心对象”(引力中心)来进行计算的。 K-Means 算法的工作过程说明如下:首先从n个数据对象任意选择 k 个对象作为初始聚类中心;而对于所剩下其它对象,则根据

文档评论(0)

yaocen + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档