- 1、本文档共35页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
物联网中的智能决策v1135
互联网用户行为分析 精准农业 市场行销 智能家居 金融安全 产品制造和质量监控 互联网用户行为分析 随着中国互联网用户数的激增,用户在互联网上的行为分析逐渐引起了关注。例如,用户在上网的时候通常需要不停地从一个网页通过HTTP链接跳转到另一个网页 获取互联网用户访问模式带来的好处很多,首先可以辅助改善分布式网络系统的性能,例如在有高度相关的站点间提供快速有效的访问通道。其次,能够帮助更好地组织和设计网页,以及帮助改善市场营销策略(例如把广告放在合适的网页上)以更好地吸引客户的注意 本章小结 内容回顾 本章介绍了数据挖掘的基本流程,重点介绍了五种典型的数据挖掘算法和步骤。最后讨论了物联网背景下数据挖掘技术的广泛应用。 重点掌握 了解数据挖掘的概念以及特点(反复迭代,人机交互)。 熟悉数据挖掘的过程(数据预处理,挖掘知识,知识评估与表示)。 理解关联分析的相关概念:关联规则(支持度/置信度),Apriori算法,频繁项集。 理解分类和预测的相关概念:判定树,期望信息,信息增益。 本章小结 重点掌握(续) 理解聚类分析与分类的区别,了解k-means算法。 了解离群点分析的三种方法(基于统计,距离偏移)。 了解演化分析的基本概念。 举例说明物联网环境下数据挖掘技术的广泛应用。 Thank you! 第13章 物联网中的 智能决策 内容提要 智能决策是物联网“智慧”的来源。 本章将介绍数据挖掘的基本流程,基本类型和典型算法。 第12章介绍了有哪些信誉好的足球投注网站引擎的相关知识 有哪些信誉好的足球投注网站引擎的基本组成 有哪些信誉好的足球投注网站引擎的体系结构(信息采集,索引技术,有哪些信誉好的足球投注网站服务) 物联网中有哪些信誉好的足球投注网站引擎的挑战 本章介绍数据挖掘的基本流程(预处理,数据挖掘,知识评估与表示),重点介绍几种典型的数据挖掘算法,最后讨论物联网中智能决策的新特点。 内容回顾 13.1 数据挖掘概述 13.2 数据挖掘的基本类型和算法* 13.3 智能决策与物联网 什么是数据挖掘?数据挖掘有哪三个步骤? 本章内容 13.1 数据挖掘概述 数据挖掘(Data Mining) 从大量数据中获取潜在有用的并且可以被人们理解的模式的过程 是一个反复迭代的人机交互和处理的过程,历经多个步骤,并且在一些步骤中需要由用户提供决策 数据挖掘的过程: 数据预处理、数据挖掘和对挖掘结果的评估与表示 每一个阶段的输出结果成为下一个阶段的输入 13.1 数据挖掘概述 数据挖掘的过程 数据预处理阶段 数据准备:了解领域特点,确定用户需求 数据选取:从原始数据库中选取相关数据或样本 数据预处理:检查数据的完整性及一致性,消除噪声等 数据变换:通过投影或利用其他操作减少数据量 数据挖掘阶段 确定挖掘目标:确定要发现的知识类型 选择算法:根据确定的目标选择合适的数据挖掘算法 数据挖掘:运用所选算法,提取相关知识并以一定的方式表示 知识评估与表示阶段 模式评估:对在数据挖掘步骤中发现的模式(知识)进行评估 知识表示:使用可视化和知识表示相关技术,呈现所挖掘的知识 13.1 数据挖掘概述 数据挖掘的过程 13.1 数据挖掘概述 13.2 数据挖掘的基本类型和算法* 13.3 智能决策与物联网 数据挖掘的基本类型和算法有那些? 本章内容 13.2 数据挖掘的基本类型和算法 数据挖掘的基本类型 关联分析(Association Analysis) 聚类分析(Clustering Analysis) 离群点分析(Outlier Analysis) 分类与预测(Classification and Prediction) 演化分析(Evolution Analysis) 描述性挖掘任务:刻划数据库中数据的一般特性 预测性挖掘任务:在当前数据上进行推断和预测 关联分析 关联分析的目标是从给定的数据中发现频繁出现的模式,即关联规则 关联规则通常的表述形式是X Y,表示“数据库中满足条件X的记录(元组)可能也满足条件Y” 以某电器商场销售记录为例: 含义:4% (支持度)的顾客的年龄在20至29岁且月收入在3000至5000元,且这样的顾客中,65% (置信度)的人购买了笔记本电脑 关联分析 挖掘关联规则,需要置信度和支持度越高越好 基本概念 项集:满足若干条件的数据项的集合,如果条件数为k,则称k-项集 满足年龄(顾客, “20~29”)的项集是1-项集 满足年龄(顾客, “20~29”) 收入(顾客, “3000~5000”)的项集是2-项集 计算步骤 首先找到具备足够支持度的项集,即频繁项集 然后由频繁项集构成关联规则,并计算置信度 关联分析 如何寻找频繁项集 Apriori算法 基本思想:利用已求出的k-项集来计算(k+1)-项集 首先计算频繁1-项集 然后根据两个频繁k-项集{p1, p2, ..., pk}
文档评论(0)