- 1、本文档共26页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
原始資料的分析-回到首頁
Regression Of Baseball Data Regression Of Baseball Data 原始資料的分析 變數變換後,再分析轉換後的迴歸模式 加入新的變數,再做分析 預測所缺失的薪水資料 原始資料的分析 原始資料的分析 原始資料的分析 原始資料的分析 變數轉換後Model之分析 變數轉換後Model之分析 變數轉換後Model之分析 變數轉換後Model之分析 變數轉換後Model之分析 變數轉換後Model之分析 加入新變數後的Model之分析 加入新變數後的Model之分析 加入新變數後的Model之分析 加入新變數後的Model之分析 加入新變數後的Model之分析 加入新變數後的Model之分析 加入新變數後的Model之分析 加入新變數後的Model之分析 預測 預測完的總結 什麼樣的人薪水較多 總結 * * 目標: 把baseball data中的各個變數, 用迴歸的方法,找出最佳的線性迴歸模式,分析選出的變數對薪水(SALARY)的影響,並且根據第一組的建議將薪水做轉換、創新變數來增加迴歸模型的解釋度。 變數名稱解釋: Response Varibale: SALARY?87年球員的薪水 Predictor Varibale: AB?上場打擊次數 C.AB?生涯上場打擊次數 HIT?安打數 C.H?生涯安打數 HR?全壘打數 C.HR?生涯全壘打數 R?回本壘得分數 C.R?生涯回本壘得分數 RBI?打點 C.RBI?生涯打點 W?保送 C.W?生涯保送 YEAR?資歷 PO?使對手出局數 ASS?助殺 (P.S這裡的「生涯」是指 ER?失誤 球員在大聯盟的資歷) The Result Of STEP: 最初先不做任何的變數變換,使用R內「step」指令,去選取原始資料中較有影響力的變數。最後所出選取較有影響的變數順序為「生涯打點」、「安打數」、「使對手出局數」、「上場打擊次數」、「保送」等五個變數(C.RBI,HIT,PO,AB,W)。接下來就對這六個變數來做迴歸分析,看看這些變數如何來解釋87年球員的薪水(SALARY)。 SALARY=-80.27+0.68*C.RBI+8.41*HIT+0.22*PO-1.86*AB+4.14*W Regression Model: Result: 原始資料的分析 Analysis: 由上一頁雖可看出,各解釋變數之係數是顯著的。其中最值得去注意的是,薪水大都會隨著解釋變數的增加而增加,除了當上場打擊次數(AB)增加,薪水反而會減少。這是蠻有意思的地方。有可能是因為:雖然他上場打擊次數很多,但有可能其表現並不佳,所以反而導致薪水隨著上場打擊次數增加而減少。 由其迴歸模式可看出,「安打數」與「保送」這兩 個變數,對於薪水的影響比其它變數大上許多。以 正常情況論,安打數多,其薪水也會比較高,是合 理的。 接下來要討論為何「保送」會影響薪水:有可能是因為選手表現好(其薪水高是合理的),所以對手寧願直接保送,也不給其打擊的機會。因此這有可能是為何「保送」會影響薪水的原因。 但由這些解釋變數去解釋87年棒球選手的薪水,解釋能力卻只有59%,解釋度並不高。因此我們希望能再造出另一新的Model,其用來解釋薪水的變數,能有不錯的解釋能力,且個各變數都是有其意義。 在此新的Model內的變數,已做變數變換了。如:87年球員的薪水,已做log轉換。除此之外,生涯的打擊次數、安打、全壘打等生涯變數,都已除上各球員在大聯盟所待的資歷。以這些新的變數,重覆之前的步驟,再重新去分析,以期望能有更不錯的結果。 IDEA: 變數變換:因為第一組的建議,因此我們將SALARY做log轉 換 換,並創以下幾個新變數。 Response Varibale: SALARY?logsal (取 log) Predictor Varibale: C.AB?AB1 (平均一年上場打擊次數) C.H?HIT1 (平均一年安打數) C.HR?HR1 (平均一年全壘打數) C.R?R1 (平均一年回本壘得分數) C.RBI?RBI1 (平均一年打點數) C.W?W1 (平均一年保送數) (以上是將所有跟生涯有關的解釋變數,皆除以其各別的 資歷,得到新的變數) 使用R
您可能关注的文档
- 第三章集中量數.ppt
- 弱导光纤线偏振模.ppt
- 第四章認識sql語言與資料型別.ppt
- 補間と近似.ppt
- 2014-2105上期复习.ppt
- 琼脂糖凝胶电泳agarosegelelectrophoresis.ppt
- 第3节自旋偶合与自旋裂分.ppt.ppt
- 推論統計介紹及抽樣與抽樣分配複習(二).ppt
- 數學期望值與二項分配.ppt
- 究竟有幾大.ppt
- 河南省郑州市第一中学2017-2018学年高一下学期周测物理试题(325)扫描版含答案.doc
- 山西省怀仁县第一中学2017-2018学年高二下学期第一次月考生物试题扫描版.doc
- 河南省六市高三下学期第一次联考试题(3月)理科综合扫描版含答案.doc
- 四川省高三全国Ⅲ卷冲刺演练(一)文综地理试卷扫描版含答案.doc
- 河南省洛阳市高三第二次统考文综试卷扫描版含答案.doc
- 甘肃省靖远县高三下学期第二次联考理科综合试题扫描版含答案.doc
- 问题导学法在办公场景中的实施策略及效果评估.docx
- 退休后的个人品牌打造与传播策略.docx
- 问题解决在办公流程优化中的应用.docx
- 问题导向的办公环境创新设计.docx
文档评论(0)