- 1、本文档共42页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第五章机器学习
思考题 学习的基本机制和主要作用是什么?试举例说明。 归纳学习的基本思想是什么?如何在特定的应用领域应用归纳学习方法?如何评价归纳学习效果? 类比学习的基本思想是什么?如何在特定的应用领域应用类比学习方法? 遗传学习的基本机制是什么?应用遗传学习方法的关键点有哪些?为什么? 你认为“数据挖掘与知识发现”方法是一种学习方法吗?为什么? 第五章 机器学习 第四节 遗传式学习 五、具体遗传算法 5、把2n条规则随机地组成n对,对每一对规则使用杂交算子或其它遗传算子,得到n对新的规则,每一条新规则的强度是它们的父母规则强度的平均值 6、用这批新规则取代知识库中原来强度最低的2n条规则,t:=t+1 # 第五章 机器学习 第五节 神经网络学习 一、感知机学习 学习权 进行权值调整 二、Hebb学习法则 根据输出和教员的指示调整权值的增长幅度 三、广义Hebb学习规则——?学习规则 注:在?学习规则中,权值调整方向是使各权值的误差平方和变得最小的方向(最小均方差)。 四、多层网络的学习 使用反传算法 五、Hopfield模型网络 使用模拟退火方法。 第五章 机器学习 第六节 数据挖掘与知识发现 一、问题的提出 1、网络技术促进信息技术的发展 a)信息过量,难以消化 b)信息真假,难以辨识 c)信息安全,难以保证 d)信息形式不一致,难以统一处理 2、数据海洋——数据分析 被数据淹没,人们却饥饿于知识 3、数据库、人工智能、数理统计、可视化技术、信息基础设施提供必有条件 DMKD成为可能 4、首次提出 IJCAI’89 (第十一届) 第五章 机器学习 第六节 数据挖掘与知识发现 二、基本概念 从大量的、不完全的、有噪声的、模糊的数据中,提取隐含在其中的、人们事先不知道的、但又有潜在有用价值的信息和知识过程。 注:1)数据源是真实的、大量的、含噪声 2)数据源支持相应的发现,但发现的知识是隐含的、事先不知道的;是发现,不是证明 3)发现的是人们感兴趣的知识,且一般是从大量的数据中提炼出抽象的知识 4)发现的知识可接受、可理解、可运用 5)不要求发现通用知识,仅支持特定的问题 6)需综合运用统计学、粗糙集、模糊数学、机器学习和专家系统、神经网络、可视化等多学科的手段与方法 第五章 机器学习 第六节 数据挖掘与知识发现 三、最常发现的知识 1、广义型知识(Generalization) 根据数据的微观特性发现其表征的、带有普遍性的、较高层次概念的、中观和宏观的知识 2、分类型知识(Classification Clustering) 反映同类事物共同性质的特征型知识和不同事物之间差异型特征知识 3、关联型知识(Association) 反映一个事件和其它事件之间依赖或关联的知识 4、预测型知识(Prediction) 通过时间序列型数据,由历史和当前的情况去预测未来的情况 第五章 机器学习 第六节 数据挖掘与知识发现 四、最有影响的发现算法 1、概念树提升算法 Simon Fraster大学J.Han 2、关联算法 IBM R Agrawal 3、分类算法C5/C4.5 Quinlan 4、遗传算法 E. Godman 第五章 机器学习 第六节 数据挖掘与知识发现 五、知识发现过程 1、数据准备 数据选取、数据预处理、数据变换 2、数据挖掘阶段 3、结果解释和评价 六、活跃的应用领域 1、市场营销 2、金融与银行业 3、电信、交通和保险业 4、政府和防卫部分 5、商务智能(业务智能,BI) 将数据变为知识,并将知识变为商业效益 第五章 机器学习 第六节 数据挖掘与知识发现 七、21世纪初DMKD研究课题 1、定性值和定量值之间的转换 a)自然语言在人类思维中具有不可替代性 b)人工智能的最基本问题——知识表示 c)Fuzzy Sets, Rough Sets d)从定性到定量的综合集成 2、数据仓库技术 数据仓库是面向主题的、集成的、与时间关联的、相对稳定的、支持决策制定过程的数据集合。它从大量的事务数据库中抽取数据,通过转换形成统一的格式。 第五章 机器学习 第六节 数据挖掘与知识发现 七、21世纪初DMKD研究课题 3、数据立方体代数 把多维数据模式中的某一属性作为观察对象,称为维(Dimension)。维可以有层次结构。将反映对象特征的属性称为指标(measure),这样的结构称为数据立方体(Data Cube)。 数据立方体的实体化是指预先执行某些计算,存储计算结果,在数据分析时直接使用。 4、Text Mining 5、Web Minin
文档评论(0)