- 1、本文档共21页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Chapter3ProducingData产生资料
Chapter 3Producing Data 產生資料 3.1 Designing Samples 3.2 Designing Experiments 動機 從(少量)的樣本(samples)推估母體(population)的特性 選用可代表母體的樣本 以儘可能不干擾母體的情況下取得資訊 觀察 vs. 實驗 觀察性研究 (observational study)。 對每一個體僅做觀察並量測有興趣的變數,並不試圖影響反應值。 抽樣調查(sample survey)。 實驗性研究(experimental study)。 對每一個體給予特定的處理(treatment),再觀察並量測有興趣的變數的反應值。 採用隨機比較性實驗(randomized comparative experiments)。 例3.1 幫助接受社會救濟的母親找工作。 欲了解參加工作訓練計劃的母親是否較容易找到工作。 因為我們無法在觀察性研究時控制被觀察者的年齡、學歷、身體狀況等會影響找工作的背景因素。觀察性研究無法告訴我們該政策的效果。 混合(Confounding)效果 兩個或兩個以上之變數(解釋變數或隱藏變數)對反應變數的影響無法區別時,稱為混合(Confounding)(又稱交絡)效果。 例如:接受職業訓練和就業輔導的效果,與受補助者本身的背景(教育程度及年齡等)的效果無法區別。 一般多以較複雜的實驗設計方法,來達到區隔效果的目的。 3.1 Designing Samples抽樣設計 母體與樣本 欲推論的所有範圍稱為母體(population) ,從母體中選出的部分個體,我們據以獲取資料,稱為樣本(sample)。 選擇樣本的方法稱為樣本設計(sample design)。 自發性回應樣本與方便抽樣 自發性回應樣本(voluntary response sample):主動對議題表達意見。 如Call-in,網頁問卷調查等。自發性回應樣本多數表達較強烈意見,因此多有偏差。 方便抽樣(convenience sampling):依調查的方便主觀選取樣本。 如街頭訪問,賣場問卷調查等。因主觀選取的地點與方法而有不同程度的偏差意見。 偏差(bias):樣本設計若造成系統性的傾向於某些結論,則稱為偏差。 用機率選取樣本 母體中每一個體被賦與一已知機率(0~1),根據個體的已知機率選出的樣本組,稱為機率樣本(probability sample)。 簡單隨機樣本(Simple Random Sample) 樣本數為 n 的樣本組,若母體中每一個體被選到的機會一樣,且每一樣本數為 n 的樣本組都有相同的機會被選到,稱為簡單隨機樣本(Simple Random Sample, 縮記為SRS): 。 簡單隨機樣本是一種機率樣本,機會一樣。 多以電腦程式、軟體選取或以隨機亂數表(table of random digits) 選取。 系統隨機樣本 系統隨機樣本(systematic random sample):樣本數為 n 的樣本,母體的總數為 N。令 N/n = k,1~k中隨機選出一數 a,則{a, a+k, a+2k, …, a+(n-1)k}為一組樣本數為 n 的系統隨機樣本。 每一個個體被選到的機會一樣。 但每一組樣本數為 n 的樣本未必有相同的機會被選到。 簡單隨機樣本的選取 步驟1:編號,母體中每一個體給一個號碼。 步驟2:查表,使用隨機亂數表選號。 30個企業體中選五個 步驟1 :列冊編號 步驟2:查表:130行資料為 69051 64817 87174 09517 84534 06489 87201 97245 前10組 2位數為 69 05 16 48 17 87 17 40 95 17 00, 31~99略去,選 05, 16, 17, 17, 17,17重複繼續 再10組 2位數為 84 53 40 64 89 87 20 19 72 45 補選 20, 19,最後選出05, 16, 17, 20, 19。 分層樣本(Stratified Sample) 分層樣本的選取 步驟一:將母體中每一個體,依有特別興趣,或是有接近性質為標準,分為若干群,稱為層(stratum)。 步驟二:每層各取一個SRS,全部合起來就是分層樣本。 歌曲著作權使用費的分配 作曲家組織(ASCAP)每年向廣播電台收取播曲權利金$ 435百萬(每年播放53百萬小時歌曲),將分配給作曲家會員。 將所有電台依社區種類(都會區、鄉村等) 、地區(新英格蘭、太平洋等)及付出權利金額度(反應電台聽眾數)等特性分成432層。 每層隨機選幾台隨機錄音數小時,共錄音6萬小時。由專家辨認所有歌曲的作曲作詞者,記錄後依比例分配權利金。 多階段樣本(Multistag
文档评论(0)