第二章 资料采掘方法规划导论.ppt

  1. 1、本文档共27页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第二章 资料采掘方法规划导论

* * 第二章 資料採掘方法規劃導論 1-2-1 資料採掘(Data Mining)運算技術應用分析 『資料採掘』技術可使得電腦不再限於被動地蒐集、儲存資料,它是可以主動協助使用者在龐大的資料堆中找出所需要的重點資料,並加以分析、預測。這種資料過濾分析的處理過程即稱為『資料採掘 (Data Mining)』或『資料探勘』。 也就是說『資料採掘 (Data Mining)』演算技術是一種多用途的資訊軟體技術,此種技術可應用在各種主從式架構 (Client/Server Structure)與網際Web 三層式或多層式 (3-Tiers/N-Tiers) 架構系統的商業邏輯程式規劃及設計上,然而,『資料採掘 (Data Mining)』卻是一種深奧的軟體技術,此種技術並不容易瞭解。且由於要運用『資料採掘』演算技術來處理各種資料分析,更要使用到很多艱澀的數學運算,因此,目前運用到『資料採掘』演算技術時,都是使用『資料採掘』專門軟體來設計或處理。 資料採掘軟體運算技術擁有非常多的演算法則與數學公式,但這些演算法則與公式最重要的目的只有兩個: (1)、使用資料採掘運算技術,利用快速的統計、分析、萃取各種異質大量資料來塑造及模擬真實世界中的模型 (Model),利用這些模型來描述資料中的特徵(Patterns)及關係(Relations)。藉由瞭解資料的特徵與關係進而提供企業做決策所需要的資訊。 (2)、使用資料採掘運算技術,分析及分類各種大量的歷史資料,藉由歷史資料分析出的結論、及分析出歷史資料的特徵,來協助企業執行各種預測,如:銷售預測、毛利預測、成本預測…等企業營運息息相關的各種預測。 1-2-2 資料採掘(DM,Data Mining)實作技術類型分析 『資料採掘 (DM,Data Mining)』最大的用途是能在極大量的資料中,透過精密的分析運算、統計篩選及分層過濾,找出符合複雜查詢條件的有效資訊。此種經過分析、統計、篩選及過濾的運算邏輯,一般統稱為『知識的採掘』。而此種知識採掘的方法,在『資料採掘 (DM)』中,稱為『資料採掘方法 (Data Mining Method)』。目前最常用的資料採掘運算方法有下列幾種: (1)、關聯規則採掘方法 (Association Rule Method)。 (2)、群集分析採掘方法 (Clustering Method)。 (3)、決策樹採掘分析方法(Decision Trees Method)。 (4)、預測查詢採掘 (Prediction) 分析方法。 (5)、遺傳演算分析方法。 (6)、回歸預測採掘分析方法。 6種常用的資料採掘方法 (Data Mining Method)中,最常應用到商業應用系統的企業邏輯設計上的有3種,分別為: (1)、決策樹採掘 (Decision Trees) 分析方法。 (2)、關聯規則採掘 (Association Rule)方法。 (3)、預測查詢採掘 (Prediction) 分析方法。 此三種資料採掘技術最重要的設計觀念在於『決策』與『分析』,與企業邏輯運算最終目的是一致的,所以非常適合用於規劃商用企業邏輯程式設計。 1-2-3 關聯規則採掘(Association Rule)方法概說 關聯規則 (Association Rule) 採掘方法是由 Agrawal 與 Srikant 於1994年提出的一種高效率的資料採掘方法,且『關聯規則』更是『知識探索資料庫系統 (KDD,Knowledge Discovery Database System)』研究及探索的重要內容。所謂『關聯規則 (Association Rule)』的採掘技術是指從交易資料庫中、挖掘及尋找具有特定關聯的規則。『關聯規則採掘技術(Association Rule)』主要用途為用來描述資料庫中所有資料與資料間的關聯性。『關聯規則』最主要的採掘實作方法為:描述消費者在購買某些商品時,同時也會購買其他特定商品的機率。若使用程式分析角度來說明『關聯規則採掘 (Association Rule)』的話,則可定義為從客戶交易資料庫中擷取出所有滿足特定搜尋條件的依賴性關係。 在資料採掘的所有關聯採掘規則的演算法中,最有名及最常用的有演算法就是『Apriori演算法』。所謂『Apriori演算法』是一種不斷掃瞄交易資料庫,利用層次過濾及消除的方法找出資料項目間的所有關聯規則的演算法。『Apriori演算法』的規劃處理方式說明如下: (1)、假設一個包含N個項目的項目集被稱為N-項目集 (N-Item-Set)。 (2)、符號L-N表示所有大型N-項目集 (Large N-Item-Set) 所成的集合。

文档评论(0)

ligennv1314 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档