- 1、本文档共39页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
01Intro数据挖掘第三版引论.ppt
* * * * * * * * * * * * * * * Add a definition/description of “traditional data analysis”. * * * * * * * * * * * Data Mining Function: (4) Cluster Analysis Unsupervised learning (i.e., Class label is unknown) Group data to form new categories (i.e., clusters), e.g., cluster houses to find distribution patterns Principle: Maximizing intra-class similarity minimizing interclass similarity Many methods and applications * Data Mining Function: (5) Outlier Analysis Outlier analysis Outlier: A data object that does not comply with the general behavior of the data Noise or exception? ― One person’s garbage could be another person’s treasure Methods: by product of clustering or regression analysis, … Useful in fraud detection, rare events analysis * Time and Ordering: Sequential Pattern, Trend and Evolution Analysis Sequence, trend and evolution analysis Trend, time-series, and deviation analysis: e.g., regression and value prediction Sequential pattern mining e.g., first buy digital camera, then buy large SD memory cards Periodicity analysis Motifs and biological sequence analysis Approximate and consecutive motifs Similarity-based analysis Mining data streams Ordered, time-varying, potentially infinite, data streams * Structure and Network Analysis Graph mining Finding frequent subgraphs (e.g., chemical compounds), trees (XML), substructures (web fragments) Information network analysis Social networks: actors (objects, nodes) and relationships (edges) e.g., author networks in CS, terrorist networks Multiple heterogeneous networks A person could be multiple information networks: friends, family, classmates, … Links carry a lot of semantic information: Link mining Web mining Web is a big information network: from PageRank to Google Analysis of Web information networks Web community discovery, opinion mining, usage mining, … * Evaluation of Knowledge Are all mined knowledge interesting? One can mine tremendous amount of “patterns” Some may fit only certain dimension spa
您可能关注的文档
- 01-毕业论文素材收集方法2015版-正文6-N个礼物.pptx
- 01-第一章-公文的含义和种类.ppt
- 01公文概述.ppt
- 03-毕业论文指导讲座-2012-9-16.ppt
- 05-单斗挖掘机.ppt
- 1.-先秦散文.ppt
- 10五四爱国运动.ppt
- 111111建党90周年主题演讲比赛-精美.ppt
- 11高级制冷1班五四青年节.ppt
- 12032921488-教师节专题:把握“教师节”商机三大策略-18页.ppt
- 在线医疗平台患者隐私保护技术集成与创新实践.docx
- 白酒行业高端化背景下消费者饮酒场景分析与品牌定位研究报告.docx
- 编制说明《兴隆咖啡师劳务品牌 深加工人员能力评定规范》.doc
- 丝芙兰美妆零售体验店2025年顾客满意度调查与分析报告.docx
- 2025年数字营销职业技能培训项目效果评估体系构建.docx
- 公路工程施工方案设计(3篇).docx
- 2025年生物质能发电项目投资回报率可行性分析报告.docx
- 编制说明《兴隆咖啡师劳务品牌 门店服务类人员能力评定规范》.doc
- 跨境电商2025年进口业务风险评估与管理优化报告.docx
- 2025年适老化改造在公共设施中的应用与发展报告.docx
最近下载
- SOP--药物临床试验急救预案.docx VIP
- 《技术转移》课件.ppt VIP
- 自动生成钻孔柱状图表格.xls VIP
- 2025年借条模板(精选20篇) .pdf VIP
- 2025年机动车检验机构内审检查表(依据评审准则和补充技术要求) .pdf VIP
- 2023ESC急性冠脉综合征管理指南(完整版).pdf
- 2025美国急性冠脉综合征(ACS)患者管理指南解读课件PPT.pptx
- 《设计小房子》教案-2024-2025学年教科版(2024)小学科学二年级上册.docx VIP
- 《夜晚的月亮》教案-2024-2025学年教科版(2024)小学科学二年级上册.docx VIP
- 1.4设计小房子 课件 2024新教科版科学二年级上册.ppt
文档评论(0)