神经网络-知识管理与数据分析实验室.ppt

  1. 1、本文档共32页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
神经网络-知识管理与数据分析实验室.ppt

* 知识管理与数据分析实验室 * 附录 必威体育精装版前沿性工作介绍(电子版) 《基于LLE和BP神经网络的人脸识别》 运用该方法的管理学博士硕士论文(代表性) 《数据挖掘技术中分类算法的比较分析》 * 知识管理与数据分析实验室 * 谢谢! 知识管理与数据分析实验室 知识管理与数据分析实验室 分类技术概论及前沿问题 * * 知识管理与数据分析实验室 主要内容 * 知识管理与数据分析实验室 * 数据分类技术概况 1 数据分类方法介绍 2 各种方法比较评述 3 分类技术前沿问题—人脸识别 4 数据分类的简含义 我们都曾经有这样的经验,在人流攒动的电影院门口等待相约而至的朋友,通过找寻与识别,能够在人群中一下子发现熟悉的脸,其实这个过程就是一个数据分类的过程。 相较于要发现的知识完全未知的无监督学习,数据分类是一种典型的有监督的机器学习方法,目的是从一组已知类别的数据中发现分类模型,以预测新数据的未知类别。 * 知识管理与数据分析实验室 * * 知识管理与数据分析实验室 * 用刚才我们提到的寻找朋友的过程举例,首先从自己熟知的朋友身上提取特点,比如脸型、身材、穿着等,这就形成了一个简单的分类模型。 然后在电影院门前对每一个发现的陌生人进行判断,“是朋友”或者“不是朋友”,从而对新数据进行了预测。 √ x x 分类技术的应用 * 知识管理与数据分析实验室 * 信用卡审批 科学研究 银行 医疗 商业 图形处理 有效性分析 故障检测 医疗诊断 目标市场定位 工业 ● ● ● 数据分类技术 数据分类的过程 * 知识管理与数据分析实验室 * 一个完整的数据分类过程一般包括模型构造、模型测试和模型应用三个步骤,具体来说,我们可以将数据分成两个数据集,分别是训练集和测试集,用于模型构造和模型测试。整体的步骤说明如下。 * 知识管理与数据分析实验室 * 1 模型构造 在这个阶段,分析样本的类别和其具备的一些特征之间的依赖关系,并将这种关系用特定的模型表示出来。 2 模型测试 测试的过程是对测试数据依次进行检测,根据模型确定样本的类别,与实际类别相比较,相同即是结果正确。 3 模型应用 这个过程与模型测试基本相同,只是输入的数据是未知的,例如,在电影院门口观察陌生人,在其中寻找朋友。 数据分类的过程详解 * 知识管理与数据分析实验室 * 数据分类方法介绍 2 数据分类方法介绍 1 各种方法评述 3 分类技术前沿问题—人脸识别 4 数据分类方法介绍 现在我们使用的分类方法中比较常用的有决策树方法、神经网络方法、遗传算法、支持向量机,除此以外还有粗糙集理论以及贝叶斯分类等方法,上图详细列出了现阶段正在使用的各种分类方法,下面将对重要方法进行介绍。 * 知识管理与数据分析实验室 * * 知识管理与数据分析实验室 * 决策树分类法 所谓“决策树”,顾名思义,它具有树状结构,根据层次的不同,节点分为根节点、内部节点和叶节点三类,每个节点对应一个样本集,根节点作为“树根”,对应的是整个样本集,内部节点类似于树干枝杈,对应样本子集,叶节点就相当于树叶了,对应一个类标志。根节点和内部节点含有一个对于样本属性的测试,根据测试的结果将样本集划分为两个或者多个子集,每个子集形成一个分支,由叶节点内的类标志来标识,就像树不断分散的枝杈茎叶一样,如右图所示。 我们用制造厂商经常使用会员分类案例来进一步说明决策树的使用方法,在分类模型中,以年龄作为属性,根节点对应的是整个样本集即所有参与某自行车厂商调查的顾客,内部节点对应样本子集,比如年龄在67岁以上的顾客群体。根节点和内部节点含有一个对于样本属性的测试,即对年龄加以限制的测试。 使用1000个会员事例训练模型后得到的决策树分类如下: * 知识管理与数据分析实验室 * 图中矩形表示一个拆分节点,矩形中文字是拆分条件。矩形颜色深浅代表此节点包含事例的数量,颜色越深包含的事例越多,如全部节点包含所有的1000个事例,颜色最深。 节点中的条包含两种颜色,红色和蓝色,分别表示此节点中的事例购买和不购买自行车的比例。这样一来,便可以通过条件得出在哪个年龄段的哪些地区的人,最容易购买自行车,至此建立了模型。 随后可以从新导入一批已知数据进行模型测试,完成这个步骤,如果模型可用,便将其他的会员在分类模型中查找就可预测会员购买自行车的概率有多大,随后自行车厂商就可以有选择性的投递广告册。 神经网络分类法 人类的大脑有近1000亿个神经元和十倍于此的神经胶质细胞。神经网络是一种具有若干连续处理结点的并行计算系统,它建立了一种数学模型,试图去模仿人类的大脑。 神经网络将每一个连接看作一个处理单元,这些处理单元结点通常称作神经元,来表明脑神经之间的关系。 * 知

文档评论(0)

wendang_12 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档