Fall资管所资料库系统专题.doc

  1. 1、本文档共23页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
Fall资管所资料库系统专题

2007 Fall資管所資料庫系統專題 Final Project DBMS support of the Data Mining Advisor: 黃三益 博士 Student: D954020005 楊宗憲 D954020006 王士豪 二○○八年一月二十三日 目錄 2007 Fall資管所資料庫系統專題 Final Project 1 1 Data Mining簡介 5 1.1 Data Mining 之定義 5 1.2 Data Mining進行的程序 6 1.3 為何使用Data Mining 8 2 Data Mining之相關演算法與功能 10 2.1 支援DM之演算法介紹 10 2.2 DM之主要用途 10 3 Data Mining SQL查詢語法 13 3.1 關聯法則探勘的幾種方案 13 3.1.1 MSQL 14 3.1.2 DMQL 15 3.1.3 OLE DB for DM 15 4 OLE DB for DM查詢語法實作技術 17 5 結論 19 6 感想 21 6.1 by 宗憲 21 6.2 by 士豪 22 圖目錄 圖 1 Data Mining 之前置步驟 6 圖 2資料採礦進行的步驟 7 圖 3建立DM model 16 圖 4 Data Mining 在企業中之角色 19 表目錄 表 1 DM之應用軟體與工具 9 表 2不同演算法對於不同用途之支援 12 Data Mining簡介 Data Mining常有人稱之為「資料採礦」或「資料探勘」。顧名思義,就是在一大群資料(礦坑)中,找到我們所需要的資訊(礦)。更嚴謹地說,Data Mining是幫助我們在一大群資料中找出pattern,賦予原本雜亂無章的資料意義,進而從中歸納出理論,而這些理論必須要有助於我們解決問題,當pattern成為知識後將創造出更大的價值,目前有商業上很多的DBMS除了基本的資料庫管理之外,也紛紛添加了資料探勘的功能在其中,此外學術中更不乏有許多新的演算法提出,藉以改善資料探勘之效能,以下第一章將先針對Data Mining作一初步之簡介。 Data Mining 之定義 資料探勘所指的是在一個確定資料中有效的,可能有用的,並且最終能被理解使用的模式,資料採礦的過程是為要發現出有意義的樣型或規則,而必須從大量資料之中以自動或是半自動的方式來探索和分析Data。 資料探勘也是一種新的且不斷循環的決策支援分析過程,它能夠從組合在一起的資料中,發現出隱藏價值的知識,以提供給企業專業人員參考 基本上,Data Mining是用來將你的資料中隱藏的資訊挖掘出來,所以 Data Mining 其實是所謂的 Knowledge Discovery 的一部份,ntelligence) 也是常見之說法。 Data Mining 使用了許多統計分析與 Modeling 的方法,資料中尋找有用的特徵(Patterns)以及關連性(Relationships)。 Knowledge Discovery 的過程對 Data Mining 的應用成功與否有重要的影響,只有它才能確保 Data Mining 能獲得有意義的結果。Data Miming 的工具是利用資料來建立一些模擬真實世界的模式(Model),利用這些模式來描述資料中的特徵(Patterns)以及關係(Relations)。這些模式有兩種用處,第一,瞭解資料的特徵與關係可以提供你做決策所需要的資訊。第二,資料的特徵可以幫助你做預測。 2.資料選擇與清除 3.任務選擇 4.選用Data Mining 演算法 5.建立知識pattern 圖 1 Data Mining 之前置步驟 圖二則為資料採礦進行的步驟,共可分下列八項 ?1. 理解資料與進行的工作 ?2. 獲取相關知識與技術(Acquisition) ?3. 融合與查核資料(Integration and checking) ?4. 去除錯誤或不一致的資料(Data cleaning) ?5. 發展模式與假設(Model and hypothesis development)? ?6. 實際資料採礦工作 ?7. 測試與檢核所採礦的資料(Testing and verification)? ?8. 解釋與使用資料(Interpretation and use) 圖 2資料採礦進行的步驟 為何使用Data Mining 因為數位化之時代,資訊之爆炸性成長使得資料不僅存於資料庫當中,更應由龐大之資料當中挖掘出有用之知識,而資訊之爆炸性成長主要是在數位化中有下列之特性: 資料大量產生: 電腦的使用率日漸普及,所以各個行業都普遍使用電腦來

文档评论(0)

sd44055 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档