- 1、本文档共29页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
* * * * * * * * * * * * * * * * * * * * * * * * * * * * 生物統計學的未來 一、引言 學術界往往很不瞭解統計學的作用 許多統計學成就來自複雜的數學和計算工具,所以只進入少數學者的視野 什麼是統計學? 統計學是一個學科,研究變異性、不確定性和面對不確定性的決策 ----對所有科學技術都重要,註定是一門多學科的科學 ----多數統計學應用和許多統計學研究是其它專業領域的科學家完成的 (DR Cox) 統計學科研的作用 統計學越來越不同於其它數學領域,電腦和資訊科學工具至少和概率論一樣重要。 統計學科研的作用是發展新的工具,應用於科學前沿。 統計學界 在美國,現有86個統計學、生物統計學和生物計量學的博士點 很大一部分統計學家工作於統計系之外 ----生物統計系、醫學院、商學院、社會科學系 ----政府機構、工業界(尤其是製藥廠) 統計學的現狀 資料收集 ----高速電腦和感測器以及某些實驗科學可產生巨量資料(例如人類基因組) ----需要新工具來組織和提取重要資訊。(National Science Foundation (1998) report 98-95) 資料和資訊的區別:將資料轉化為資訊需要統計理論和實踐方面的洞察力、技術和訓練。(Zelen) 統計學的現狀 科研合作的機會增多 ----應用、多學科課題中統計學的錯用嚴重 ----由於大量資料的產生,人們主張統計人員進入研究團隊 (National Science Foundation (1998) report 98-95) 統計學的現狀 科學引用指數(Science Citation Index): 1991-2001年其間25位引用最多的數學科學家中18位是統計學或生物統計學家; Journal of the American Statistical Association是被引用最多的數學科學雜誌; 最重要的一篇文章是Efron (1979)引入boostrap方法;500次最近的引用中只有152次出現在統計學文章中 統計學的核心 統計學與數學的其它分支不同,總是和應用、結果的重要性聯繫在一起。(National Science Foundation (1998) report 98-95) 統計學的核心是學科內在的東西,而不是特定科學問題對統計學的要求。 統計學核心方面的研究著重基於該學科普遍原理發展統計模型、方法和相關理論。 統計理論和統計實踐 有些同事稱自己是數理統計學家或應用統計學家。這兩個術語過時了,必須丟棄。 前者不和資料打交道,後者不涉及理論(Selen) 二、統計研究面臨的挑戰 資料增長的規模: 數據----指數 資料分析----二次方 統計學家----線性 資料縮減和壓縮 “縮減”:用新的思路指導模型選擇、預測和分類“壓縮”:深刻瞭解資料結構有助於壓縮儲存和較好地重現。 統計學界以外的資料分析 ----許多方法和計算策略是統計學界以外發展起來的(如machine learning和neural network) ----未來研究應將這些machine learning和其它方面發展起來的大量、複雜資料集的分析方法納入統計學核心知識。 ----如果我們的目標是利用資料解決問題,那末我們必須從單純依靠資料模型走向採納各種各樣工具。 大p小n多變數分析 例:曲線資料、譜、圖像、DNA微陣列 ----幾乎沒有現成的統計理論支持和理解主成分分析、典則分析等用於降維的富有啟發性的方法 ----其它領域的創新可能有助於這個問題。 例: 隨機矩陣理論,過去40年發展了有許多模型和方法,近年引起了概率和組合數學方面極大的興趣。 Bayes和有偏估計 發展和開拓Bayesian方法和現代非參數、半參數統計之間的聯繫,包括研究Bayesian和and frequencist結合的方法學。 ----對於具有大量變數的巨型資料,需要更廣泛的有偏估計理論。 ----也需要進一步的Monte Carlo方法做推斷。 證明和計算實驗之間的中間地帶 證明– 太難,或非頭等重要 計算實驗– 太任意和不足以令人信服 例: 混合模型– 大多忽略識別問題,因為困難,並加重模型結構的多樣性 三、生命科學中的統計學 上半個世紀的里程碑: --生物統計學 --統計流行病學
文档评论(0)