线性与非线性变数缩减方法比较-应用於蛋白质资料.pdfVIP

线性与非线性变数缩减方法比较-应用於蛋白质资料.pdf

  1. 1、本文档共11页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
线性与非线性变数缩减方法比较-应用於蛋白质资料.pdf

線性與非線性變數縮減方法比較- 應用於蛋白質資料 指導教授:余清祥 教授 報告學生:黃靜文 報告日期:2005年3月24日 研究動機 欲尋求最適的病例篩選方法。 且變數過多,變數縮減方法將列入考量。 本研究欲探討有效的便數縮減方式,企圖找 出最適的病例篩檢方法。 資料簡介 779個質量區間(變數)。 資料類別 NO BPH CAB CCD 受測者個數 82 77 84 83 觀測值個數 164 154 168 166 模擬時,分為訓練和測試資料,比例約9: 1,且成對抽取。 模擬次數以100次為主。 分類方法 採取何分類方法? 主要比較SVM和類神經網路。  SVM:將資料用一直線或一超平面能利用將不同數值的 反應變數分開。   每一個節點的輸出,都乘上其相對應的加權重再加總, 再透過激發函數的計算產生輸出訊號。實用上,適合 診斷、預測等應用。 分析方式:將所有資料變數置入以進行分類。 分類方法(續) 以四組分類來說,類神經網路表現較差。 以兩兩分類來說,SVM和類神經分類表現無異。 為了使用上的方便,故選擇類神經網路。 Raw(SVM) Raw(NN) 4 Groups 0/ 18.38 8.05/21.74 NO/BPH 0/5.85 0.04/4.85 NO/CAB 0/5.48 0.12/5.52 NO/CCD 0/5.8 0/5.95 BPH/CAB 0/5.8 0.16/5.85 BPH/CCD 0/ 8.73 0.21/8.57 CAB/CCD 0/ 15.15 0.88/ 15.9 註 : Average Train/Test Error Rate (%) 變數縮減方法 原因:變數過多,分析、比較不容易。 目的:降低資料維度,擷取重要資訊, 方便分析。 型態:分為線性和非線性。  線性:主成分分析(PCA)  非線性:主成分分析網路,為類神經網 路(NN)之變形。  綜合:結合線性和非線性變數縮減方法。   主成分分析 經過PCA再進行類神經分類。 各組皆較未經便數縮減進行分類皆有改善,但 不顯著。 計算時間減少。 分類 SVM NN NN 變數縮減 Raw Raw PCA 4 Groups 0/ 18.38 8.05/21.74 0/ 17.61 NO/BPH 0/ 5.85 0.04/4.85 0/4. 13 NO/CAB 0/ 5.48 0. 12/5.52 0/4.57 NO/CCD 0/ 5.8 0/5.95 0/

文档评论(0)

docindoc + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档