- 1、本文档共82页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第十章 集群分析 第一節 集群分析原理 第二節 SPSS的分層集群分析法 第三節 SPSS的K-Means集群分析法 第四節 SPSS的TwoStep集群分析法 第五節 集群分析範例 學習目標 認識集群分析的基本概念與目的。 瞭解集群分析的演算步驟。 探討相似性的衡量方法與公式。 理解層次集群法中的群與群間距離計算的各種方法。 認識集群結果的解釋、命名、驗證和後續分析。 認識SPSS的層次集群法程序、介面操作與結果分析。 認識SPSS的K-Means集群法程序、介面操作與結果分析。 認識SPSS的TwoStep集群法程序、介面操作與結果分析。 認識SPSS的各種因素分析應用實例。 瞭解集群程序的集群結果如何進行各種後續分析。 第一節 集群分析原理 一、集群分析的基本概念 二、集群分析的主要步驟 三、相似衡量 四、集群方法 五、集群結果的解釋和驗證 六、SPSS的Cluster分析程序 集群分析原理 集群分析(Cluster Analysis)是將資料檔中的觀測值或變數加以歸類在各個集群內,也就是把沒有分群的個體按相似程度歸於同一群。集群分析可以作資料簡化。 集群分析分群的方法有兩大形式,分層法(Hierarchical)與非分層法(Non-hierarchical),結合兩種方法的集群分析則稱為兩階段法(Two Step)。 分層法以個體間某項量測的距離或相似性將個體連結,但是事前並不知道分群的個數,通常可表示成樹型圖。 非分層法則是於事前依據其他研究或主觀認定,決定要將群體分成幾群,其中以K平均值法(K-Means)為代表。 圖10-1 SPSS的Cluster程序 一、集群分析的基本概念 集群分析使在同一集群內的事物具有高度的同質性(homogeneity),而不同集群的事物具有高度的異質性(heterogeneity)。 亦即將樣本分成幾群互相沒有交集的群組。 因素分析是將同質性高的變數(variables)集成一群;而集群分析則是將變數相似性高的觀察值(cases)集成一群。 集群分析的大部分應用都屬於探索性研究,最終結果是產生研究對象的分群。 二、集群分析的主要步驟(1/2) 集群分析至少都應該包括以下四個步驟: 第一步:根據研究的目的選擇合適的分群變數 第二步:計算相似性衡量 第三步:選定集群方法進行集群 第四步:對結果進行解釋和驗證 分群變數應該具有以下特點: 1. 和集群分析的目標密切相關 2. 反映了要分群對象的特徵 3. 在不同研究對象上的數值具有明顯差異 4. 變數之間不應該有高度相關 集群分析的主要步驟(2/2) 選擇分群變數時要注意克服「加入盡可能多的變數」這種錯誤觀念。 此外所選擇的變數之間不應該高度相關。 選定了分群變數,下一步就是計算研究對象間的相似性。相似性反映了研究對象間的親疏程度。 計算出相似性矩陣之後,下一步就是要對研究對象進行分群。這時主要涉及到兩個問題:一是選定集群方法;二是確定形成的分群數。 得到集群結果後,最後一步還應對結果進行驗證和解釋。 三、相似衡量(Measure) 很多種相似的衡量方法,都從不同的角度衡量了研究對象的相似性,其主要分為以下二類:1.距離衡量;2.關聯衡量。 距離衡量-計量資料: 關聯衡量-計質資料 1. 卡方值測距(Chi-square measure): 2. Phi平方值測距(Phi-square measure): 3. 二進位資料(Binary): 四、集群方法:層次集群法 層次集群法又可分為兩種層次集群法:凝聚法 (Agglomerative Method,或稱聚集法)和分離法 (Divisive Method,或稱分解法)。 凝聚法首先是把每個觀察值各自看成一群,先把距離最近的兩群合併。直到合併成一大群為止。 分解法和聚集法的過程相反,每一步增加一群,直到每個觀察值都自成一群為止。 目前SPSS採用凝聚法,故層次聚集法是集群分析中應用最廣泛的集群方法。 層次集群法的集群過程可以用一個樹狀圖(Dendogram)表示出來。 圖10-2 群與群距離計算方法比較的示意圖 圖10-3 以身高與體重進行最短距離法集群所得到的樹狀圖 圖10-4 以身高與體重進行最遠距離法集群所得到的樹狀圖 平均連結法(Average Linkage) 把兩群間的距離定義為兩群中所有觀察值之間距離的平均值,不再依賴於特殊點之間的距離。 平均連結法為集群效果較好、應用較廣泛的一種集群方法。 重心法(Centroid Clustering)與中位數法(Median Clustering) 圖10-5 以身高與體重進行重心法集群所得到的樹狀圖 最小變異數和法(華得法) 其基本思想是同一群內觀察值的變
您可能关注的文档
- 鸡尾酒的调制毕业论文.doc
- 积冰对飞行的影响及处置.docx
- 积分因子法在常微分方程中的应用 开题报告.doc
- 基建和生产标准差异协调统一条款(线路部分).doc
- 基因工程基本工具练习.doc
- 基于GSM模块的红外线防盗报警器毕业论文.doc
- 基于Java的超市系统设计与实现开题报告.doc
- 基于matlab的三种面值人民币的自动识别(燕山大学).doc
- 基于matlab的数字音效处理器——数字信号处理课设报告.doc
- 基于MATLAB的信息率失真函数计算本科毕业论文.doc
- 2023年江苏省镇江市润州区中考生物二模试卷+答案解析.pdf
- 2023年江苏省徐州市邳州市运河中学中考生物二模试卷+答案解析.pdf
- 2023年江苏省苏州市吴中区中考冲刺数学模拟预测卷+答案解析.pdf
- 2023年江苏省南通市崇川区田家炳中学中考数学四模试卷+答案解析.pdf
- 2023年江西省吉安市中考物理模拟试卷(一)+答案解析.pdf
- 2023年江苏省泰州市海陵区九年级(下)中考三模数学试卷+答案解析.pdf
- 2023年江苏省苏州市高新二中中考数学二模试卷+答案解析.pdf
- 2023年江苏省南通市九年级数学中考复习模拟卷+答案解析.pdf
- 2023年江苏省南通市海安市九年级数学模拟卷+答案解析.pdf
- 2023年江苏省泰州市靖江外国语学校中考数学一调试卷+答案解析.pdf
最近下载
- 二年级家长会班主任发言稿 VIP
- 2023-2024学年上海市位育中学八年级上学期期中考试英语试卷含详解.docx VIP
- 【自做】白雪公主PPT正常版.ppt
- 名著阅读《群英会蒋干中计》课件精品课件(选自罗贯中《三国演义》;34页).pptx VIP
- 2023-2024学年北京某中学八年级上学期期中考试英语试卷(含详解).pdf VIP
- 手术患者意外伤害预防.pptx
- 2024年初中信息技术学业水平合格性考试题库含答案.pdf
- 2024-2025学年小学科学一年级上册(2024)教科版(2024)教学设计合集.docx
- 2024全国中考语文试题分类汇编:记叙文阅读.pdf VIP
- 英语国家概况100问及答案.doc
文档评论(0)