数学与猜想----数学期望值-龙腾文化.doc

  1. 1、本文档共10页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数学与猜想----数学期望值-龙腾文化.doc

一、前言 》 99課程數學課本第二冊第4章數據分析單元介紹使用「最小平方法」求二維數據的迴歸直線方程式,並進而使用迴歸直線來做預測。但是若有兩組數據,且已經分別求出各自的迴歸直線,那麼我們如何知道哪一組的迴歸直線較適合用來做預測呢?也就是說,迴歸直線雖然名稱為「最佳直線」,但用來做預估時,應有它準確性的限制,而所產生的誤差究竟有多大呢?本文即是探討二維數據的迴歸直線用來做預測時,所產生的誤差。 二、迴歸直線方程式推導 》 各個高中數學課本版本對於推導迴歸直線方程式有所不同。翰林版與康熹版採用原始數據直接配方後而得〔註1〕〔註2〕,而龍騰版、南一版、全華版、三民版則是先將原始數據標準化後再配方〔註3〕〔註4〕〔註5〕〔註6〕。本文使用原始數據去推導迴歸直線,但是推導的過程與前述課本的方法有所不同,分別採用「改良式配方法」與「解二元一次方程組」兩種方法。 方法一:改良式配方法 有別於課本中的傳統配方法,在此將拆開成三項:與與,再平方展開,推導過程如下: 因為, 同理 故原式可繼續推導得到 , 我們發現上式為A、B、C三項的組合,其中 觀察A,B,C三項可知: 與a,b無關, 欲產生最小值, 必須,亦即, 而 , 由上式可知,欲使C產生最小值,必須 ,亦即 , 若以上式解出的b代入,即可得到。 方法二:解二元一次方程組 在這個方法中,將誤差平方展開後,依a,b分類,令一為常數,另一為變數,並配方後求方程組的解。 , 令b為常數,則欲使產生最小值,必須 ,亦即 同樣方法,若 令a為常數,則欲產生最小值,必須 ,亦即 由以上結果,可得到以a,b為變數的二元一次方程組 由克拉瑪公式,得到方程組的解為 以上兩種推導的方法,其結果相同,得到迴歸直線方程式為,其中直線斜率,而y截距。 三、迴歸直線之誤差計算 》 若是給定一組數據,我們已經可求出迴歸直線,而且知道這條直線是最能擬合原始數據的「最適合直線」,但問題是:擬合的程度是如何?若是用迴歸直線來預測未知的數值時,其預測的誤差有多大?準確性有多高?為了解答上述的疑惑,以下我們針對預測所產生的誤差來討論。 因為迴歸直線方程式為,令的預測值為,則可推導得(推導過程見附錄)。 我們發現,可看成是一不變量,它不受迴歸直線方程式係數所影響,且此不變量由兩部分與所組成,而後者則是最小平方法所計算之誤差平方和,可視為以迴歸直線所預測產生錯誤的部分,相對而言,前者則可視為以迴歸直線準確預測的部分,此兩部分組成總不變量。 在實際估算時,若是要求預測能夠準確,則錯誤預測的部分要愈小愈好,正確預測的部分要愈大愈好,但這些數值受到數據個數n的影響,也就是數據個數愈多,則誤差平方和當然愈大,但不代表預測不準確,故我們轉而計算預測正確部分在總不變量中占了多少百分比,因為 , 所以 , 因為我們知道x,y的相關係數,故由上面的推導,我們發現剛好等於相關係數的平方,此數值稱為決定係數(coefficient of determination)〔註7〕,它表示用迴歸直線來做預測時的準確度,當決定係數愈大時,表示迴歸直線所做的預測愈準確。 四、實例分析 》 以下這個實例係採自龍騰課本第二冊第200頁的例題〔註3〕,我們將它延伸至求預測的準確度。 實例:若有甲乙丙丁戊5個考生,其筆試與口試的成績如下表: 考生 甲 乙 丙 丁 戊 筆試成績x 5 5 4 7 9 口試成績y 3 1 4 3 9

文档评论(0)

youbika + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档