- 1、本文档共29页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
邱皓政2007统计原理与分析技术02__描述统计.ppt
讓數字會說話三F 描述統計 Descriptive Statistics 描述統計概說 描述統計的定義 一套用以整理、描述、解釋資料的系統方法與統計技術 數據從初始狀態(raw data)成為可被理解的統計量數(statistic)的一套操作程序 透過統計量數來描述大量資料,並作為彼此溝通的共同符號語言 量化數據的處理 統計圖表 運用次數分配表來整理並描繪變數數值分佈情形 利用統計圖表來表現出數據的特性與分佈情形 描述統計量 統計量(statistic):由樣本所獲得的原始資料所計算推導出的統計量數 當統計量由樣本所獲得的數據計算得出,是描述樣本數據特性的最佳指標,通常以英文字母表示,例如 與s。 當統計量由母體數據,描述統計所產生的量數稱為參數或母數(parameter),用以描述母體數據的分佈特性,通常以希臘字母表示,例如μ與σ。 次數分配 功能 提供原始資料的基本資訊 作為資料檢查的判讀工具 提供統計技術選擇與如何分析的線索 傳統作法 將原始資料進行初步分類 以人工劃記方式編碼(coding),具有類別、次數、累積次數、百分比等訊息的次數分配表 基本欄位 變項數值(value):位置於左側 數值次數(frequencies):位置於右側 以人工劃記所製作的次數分配表 SPSS製作的次數分配表 分組次數分配表 組數以10至20組之間為宜,組距則以2、5、10三個可將10整除的因數為宜。 組數越多表格越大,但是資訊較豐富,組數越少表格越精簡,但遺失的資訊較多。 次數分配各相關名詞 ■次數分配(frequency distribution): 由某個變項各數值(各組)的次數所組成的分配,如前表的第一欄。 ■相對次數分配(relative frequency distribution): 由某個變項各數值(各組)的次數除以總數(稱為相對次數)所組成的分配。如果把相對次數乘以100%,即為百分比分配,如前表的第二欄。 ■有效百分比分配(valid percentage frequency distribution): 由某個變項各數值(各組)次數除以扣除遺漏值的次數乘以100%後的分配,如前表的第三欄。(在沒有遺漏值的情況下,有效百分比分配等於百分比分配) ■累積次數分配(cumulative frequency distribution): 由某個變項各數值(各組)的次數往上或往下累計所組成的分配。 ■累積相對次數分配(cumulative relative frequency distribution): 由某個變項各數值(各組)的次數除以總數,以往上或往下累計所組成的分配。如果把相對次數乘以100%後再累計,即為累積百分比分配,如前表的第四欄。 集中量數 集中量數(measures of central location) 用以描述一組數據或一個分配集中點的統計量數 一個能夠描述數據的共同落點的指標。 常用的集中量數有平均數、中位數及眾數 平均數 平均數(mean;以M表示) 取某一變項的所有數值的總和除以觀察值個數所得到的值 因為是將數據直接以數學算式來計算平均值,又稱為算術平均數(arithmetic mean)。 母體資料得出的平均數需以希臘字μ表示 樣本資料得出的平均數以表示 中位數 中位數(median;或以Mdn表示) 又稱為中數、百分等級為50的百分位數(P50)或第二四分位數(Q2; second quartile)。 將某一個變項的數據依大至小或由小至大排列,取位居最中間、或能夠均勻對分全體觀察值的分數 在中位數之上與之下,各有50%的觀察值。 眾數 眾數(mode;或以Mo表示) 一組分數中,出現次數最多的一個分數 一組數據中最典型(typical)的數值或次數分配最高點所對應的分數 是各集中量數當中,最容易辨認的量數 一個分配有兩個分數具有相同的最高次數,此時即出現了雙眾數,稱為雙峰分配(bimodal distribution) 集中量數的特性與優缺點比較 三種集中量數與分配形狀的關係 變異量數 變異量數(measures of variation)或離散量數 用來描述觀察值在某一個變項上的分數分散情形的統計量 描述統計中,集中量數必須搭配變異量數,才能反應一組數據的分佈特徵 常用的變異量數包括全距、四分差、變異數及標準差 全距 全距(range) 一組分數中最大值(Xmax)與最小值(Xmin)之差 是一群分數變異情形最粗略的指標 全距容易計算,適用性高,可以應用在名義變項與順序變項,來求出變項當中類別的多寡。 缺點是不精確也不穩定,無法反應一個分配的每個數值的狀態。 四分差 四分差(se
文档评论(0)