[统计分析方法讲座.第一讲..ppt

  1. 1、本文档共38页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
[统计分析方法讲座.第一讲.

典型统计分析方法及应用 目录 前言 一、为什么我们需要了解统计分析方法? 我国学者、教学科研人员大多重视思辨性思维,空泛的议论多,而逻辑推理的思维方式淡化,更不追求严密的公理化体系。 定量分析方法能使人们对质的规律性的认识更加深入全面。 定量分析的推动因素 技术因素(供方) 二、统计分析方法的分类 统计分析不能替代 ….. 好的简报 好的研究方案设计 好的运作执行和质量控制 你和你的研究小组清晰的思路 你更好的理解正常人(非市场研究人员)如何思考和认识你所研究的市场 但是统计分析是一种非常重要的研究方法,你将回在工作中接触和使用它 聚类分析 目录 引例 岗位评估就是确定某岗位对企业或组织战略实现和未来发展相对价值。只有明确了各个岗位对企业或组织发展的重要程度,才能有针对性的设计薪酬结构和薪酬水平。聚类分析可以确定岗位级别。 企业文化被喻为“企业生命常青藤”,既具有其独特性,也具有很强的通用性,处于不同行业,从事不同业务的企业间往往具有相似的企业文化要素特征。运用聚类分析方法,根据企业文化的要素特征帮助人们从定量的角度识别企业文化的类别,这有助于具有相似企业文化特征的企业间相互借鉴。 商业竞争中存在帕累托法则 ,即企业20%的客户贡献了80%的利润。通过聚类分析可以将价值客户群分为有价值易流失的客户群、有价值稳定的客户群、低价值不稳定的客户群和低价值稳定的客户群,从而针对不同的客户群,采取不同的服务、推销和价格策略来稳定有价值的客户,转化低价值的客户,消除没有价值的客户。 聚类 把研究目标分割成为具有相同属性的小的群体 聚类分析 对于一个数据,人们既可以对变量(指标)进行分类(相当于对数据中的列分类),也可以对观测值(事件,样品)来分类(相当于对数据中的行分类)。 比如学生成绩数据就可以对学生按照理科或文科成绩(或者综合考虑各科成绩)分类, 当然,并不一定事先假定有多少类,完全可以按照数据本身的规律来分类。 聚类分析(cluster analysis)分为R型聚类和Q型聚类。对变量的聚类称为R型聚类,而对观测值聚类称为Q型聚类。这两种聚类在数学上是对称的,没有什么不同。 聚类分析的目的 根据已知数据,计算各观察个体或变量之间亲疏关系的统计量(距离或相关系数)。根据某种准则(最短距离法、最长距离法、中间距离法、重心法),使同一类内的差别较小,而类与类之间的差别较大,最终将观察个体或变量分为若干类。 聚类分析的原理 如何度量远近? 如果想要对100个学生进行分类,如果仅仅知道他们的数学成绩,则只好按照数学成绩来分类;这些成绩在直线上形成100个点。这样就可以把接近的点放到一类。 如果还知道他们的物理成绩,这样数学和物理成绩就形成二维平面上的100个点,也可以按照距离远近来分类。 三维或者更高维的情况也是类似;只不过三维以上的图形无法直观地画出来而已。在饮料数据中,每种饮料都有四个变量值。这就是四维空间点的问题了。 两个距离概念 按照远近程度来聚类需要明确两个概念:一个是点和点之间的距离,一个是类和类之间的距离。 点间距离有很多定义方式。最简单的是歐氏距离,还有其他的距离。 当然还有一些和距离相反但起同样作用的概念,比如相似性等,两点越相似度越大,就相当于距离越短。 由一个点组成的类是最基本的类;如果每一类都由一个点组成,那么点间的距离就是类间距离。但是如果某一类包含不止一个点,那么就要确定类间距离, 类间距离是基于点间距离定义的:比如两类之间最近点之间的距离可以作为这两类之间的距离,也可以用两类中最远点之间的距离作为这两类之间的距离;当然也可以用各类的中心之间的距离来作为类间距离。在计算时,各种点间距离和类间距离的选择是通过统计软件的选项实现的。不同的选择的结果会不同,但一般不会差太多。 向量x=(x1,…, xp)与y=(y1,…, yp)之间的距离 向量x=(x1,…, xp)与y=(y1,…, yp)之间相似系数 事先要确定分多少类:k-均值聚类 前面说过,聚类可以走着瞧,不一定事先确定有多少类;但是这里的k-均值聚类(k-means cluster,也叫快速聚类,quick cluster)却要求你先说好要分多少类。看起来有些主观,是吧! 假定你说分3类,这个方法还进一步要求你事先确定3个点为“聚类种子”(SPSS软件自动为你选种子);也就是说,把这3个点作为三类中每一类的基石。 然后,根据和这三个点的距离远近,把所有点分成三类。再把这三类的中心(均值)作为新的基石或种子(原来的“种子”就没用了),重新按照距离分类。 如此叠代下去,直到达到停止叠代的要求(比如,各类最后变化不大了,或者叠代次数太多了)。显然,前面的聚类种子的选择并不必太认真,它们很可能最后还会分到同一类中呢。下面用饮料例的数据来做k-

文档评论(0)

wu12youli + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档