- 1、本文档共68页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
Lect7.2(北大统计与数据分析-数据分析方法基础之二)
《《《《统计与数据分析统计与数据分析统计与数据分析统计与数据分析》》》》
Statistics Data AnalysisStatistics Data AnalysisStatistics Data AnalysisStatistics Data Analysis
§§§§7777 数据分析方法基础数据分析方法基础数据分析方法基础数据分析方法基础
(Part II)(Part II)
ZZZZhhhhhhhhuu Huauu HuaHuaHuaiiiiiiiiqqqqiiiiiiiiuuuu
@Peking University@Peking University@Peking University@Peking University
人们一直宣称,世界会由数字来统治。但我所知道的是,数字
会告诉我们会告诉我们,,它被利用得是好还是坏它被利用得是好还是坏。。
( 《歌德对话录》,1836年)
数据,尤其是大量的数据,通常不能提供信息。而统计学家的
数据,尤其是大量的数据,通常不能提供信息。而统计学家的
目的是揭示这些数据所包含的信息。
——John Tabak ( 《Probability Statistics—The Science of Uncertainty 》in 2004)
§§§§7.47.47.47.4 聚类分析方法聚类分析方法聚类分析方法聚类分析方法
分类问题分类问题分类问题分类问题
条件条件::已知研究对象总体的类别数目已知研究对象总体的类别数目
及其特征及其特征及其特征及其特征 ((((如如如如::::分布规律分布规律分布规律分布规律,,,,或各类的或各类的或各类的或各类的 判别分析判别分析判别分析判别分析
训练样本)训练样本) (Discriminant(Discriminant
目的目的目的目的::::判断未知类别的样本的归属类判断未知类别的样本的归属类判断未知类别的样本的归属类判断未知类别的样本的归属类 Analysis)Analysis)
别别
条件条件条件条件::::研究对象总体的类别数目未知研究对象总体的类别数目未知研究对象总体的类别数目未知研究对象总体的类别数目未知,,,,
也不知总体样本的具体分类情况也不知总体样本的具体分类情况
目的目的目的目的::::通过分析通过分析通过分析通过分析,,,,选定描述个体相似选定描述个体相似选定描述个体相似选定描述个体相似 聚类分析聚类分析聚类分析聚类分析
程度的统计量、确定总体分类数目、程度的统计量、确定总体分类数目、 (Clustering(Clustering
建立分类方法;对研究对象给出合理建立分类方法;对研究对象给出合理 Analysis)Analysis)
的分类。的分类。(“(“物以类聚”是聚类分析的物以类聚”是聚类分析的
基本出发点基本出发点))
聚类分析:聚类分析: (群分析)(群分析)
实用多元统计分析的一个新分支实用多元统计分析的一个新分支实用多元统计分析的一个新分支实用多元统计分析的一个新分支,,,,正处于发展阶段正处于发展阶段正处于发展阶段正处于发展阶段。。。。理论上理论上理论上理论上
尚未完善,但应用十分广泛。尚未完善,但应用十分广泛。
实质上是一种分类问题,目的是建立一种分类方法,将一实质上是一种分类问题,目的是建立一种分类方法,将一
批数据按照特征的亲疏批数据按照特征的亲疏批数据按照特征的亲疏批数据按照特征的亲疏、、、
文档评论(0)