- 1、本文档共103页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
Copyright 2003-12, SPSS Taiwan Corp. 研討會內容 一 資料採礦的秘辛 資料採礦觀念 資料採礦到底是什麼?為什麼要做資料採礦? Data Mining 和統計及OLAP有什麼不同? Data Mining 和 Data Warehousing 的關係 Data Mining 的方法與特徵 怎麼做好Data Mining? 何謂CRISP-DM及其重要性 研討會內容 二 Clementine中文版功能說明 Clementine的工作環境及其方便容易的操作能力 完全中文化的介面 和CRISP-DM的結合 協助整理串流跟輸出的管理員 用串流方式做資料採礦 超級節點 研討會內容 二 Clementine中文版功能說明 對應CRISP-DM,Clementine有哪些功能 (一) Clementine 在商業理解階段提供的功能 (二) Clementine 在資料理解階段提供的功能 (三) Clementine 在資料預備階段提供的功能 (四) Clementine 在塑模階段提供的功能 (五) Clementine 在評估階段提供的功能 (六) Clementine 在部署階段提供的功能 Data Mining 是什麼? Data Mining是從資料中找出有用珍貴知識的一個過程 為什麼要做 Data Mining? 競爭日益劇烈,了解客戶需求才能佔有優勢 過去及現在和客戶互動方式的改變 Data Mining 和統計不同? Data Mining 沒有事先假設 多數狀況下母體參數已知 資料量越大越好,小資料也可以挖只是較不可靠 融合各種知識,包括統計、Machine Learning、人工智慧、基因等 Data Mining 和 OLAP 不同? Data Mining 和資料倉儲的關係 何謂資料倉儲 (Data Warehousing)? 將現有資料、歷史資料、外部資料等經過有系統的整合,把資料選取、分類、轉換達到最佳化後,融入一個設計好的關連式資料庫中,以利資料分析者存取,大量改進效率。 Data Mining 及 OLAP 都是由資料倉儲中取出資料分析 資料採礦的定位 Data Mining 的方法 Classification Clustering Estimation Prediction Market Basket Analysis Description Data Mining 的其他特徵 Interactive 互動性 Automation 電腦自動化 Continuing 連續性,是動態的 團隊分工合作 具有決策功能,使企業組織創新、再造 目標:一對一個人化(Personalize) 怎樣才能做好 Data Mining Process 符合 Data Mining 的程序,如 CRISP-DM CRISP-DM 標準流程 Cross-Industry Standard Process for Data Mining SPSS 和 NCR 在 1996 年為克萊斯勒做資料採礦時訂出的一套標準程序,並參加了專家意見修訂,目前版本為1.0 1. Business Understanding 了解企業方針及要解決的問題何在 訂定 Data Mining 計畫 2. Data Understanding 收集初步資料 簡單了解資料 確認資料品質 3. Data Preparation 資料清理、整合 格式設定,為下一步建立模型做準備 4. Modeling 選定要建立的模型 用上一步驟的資料建立模型並測試 5. Evaluation 評估模型及回顧整個過程 決定是否進入下一階段 6. Deployment 計畫要怎麼部署 監控部署過程 產出報告並檢討 CRISP-DM 流程圖 以資料為中心 不斷循環 不是從頭做到尾,有需要時可以往回 Clementine 中文版 現代淘金者 的最佳資料採礦工具 工作環境—完全中文化 工作環境—介面介紹 工作環境—專案管理 一個專案可以包括多個串流、圖表、各種外部檔案,全部可以利用右下角的專案管理員整理起來。 優點:不用每次都去找要用的檔案跟相關串流,直接開啟專案,所有相關物件都會出現在專案管理員中。 工作環境—配合CRISP-DM流程 可將各種檔案及流程圖分門別類整理在六個CRISP-DM步驟的資料夾中,方便任何使用人員隨時存取。 很清楚所做過的流程,有架構不紊亂。即使非原始的建立者也可以迅速進入狀況。 也可依自己需求增減資料夾 工作環境—管理員 Clementine會自動將所有流程放在「串列」區,跑出的圖表放在「輸出」區,建立的模型則放在「模型」區,隨時可以點選不用重跑一遍。且這些結果都可儲存保留。 工作環境—用串流方式呈現 上使用者在工作區
您可能关注的文档
最近下载
- 兄弟 DCP-7080 7080D 7180DN MFC7380 7480D 7880DN 维修手册.pdf
- 2024年部编版七年级上册道德与法治期中综合检测试卷及答案.docx VIP
- 3.6.2 中医特色康复医疗的服务标准及规范.docx VIP
- 高低压配电设备设施二级保养记录表.docx VIP
- 2022年上海市高考英语一模试卷2022年上海市高考英语一模听力mp3.pdf
- 2024年浙江省网络安全行业网络安全运维工程师项目职业技能竞赛试题库(初赛+决赛).docx
- 高二上学期期中考试化学试题(含答案).pdf VIP
- 宏碁(Acer)Aspire系列 Aspire R7-571 说明书.pdf
- 中草药栽培技术 环境条件对中草药生长发育的影响 环境条件对中草药生长发育的影响.pptx
- 关于医院医疗领域群众身边不正之风和腐败问题集中整治工作方案.docx VIP
文档评论(0)