数据挖掘在各领域的应用.ppt

  1. 1、本文档共61页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据挖掘在各领域的应用整理

數據挖掘于各领域之应用 谢邦昌 教授 辅仁大学统计信息系教授 中华數據挖掘协会 秘书长 STAT1001@MAILS.FJU.EDU.TW WWW.CDMS.ORG.TW 2004/12/26 你不能不知的十大创新技术 资料来源: Technology Review杂志(2002/1) 未来科技大预言 Technology Review杂志公布改变未来的十项新兴趋势 机器与人脑的介面 塑料电晶体 數據挖掘(Data mining) 数字权利管理 生物测定学(Biometrics) 语言识别处理 微光学技术(Microphotonics) 解开程序码(Untangling code) 机器人设计 微应用流体学(Microfluidics) 在生物科技上,如人脑与机器介面,可加速发展生化义肢,学者认为这方面大有潜力。 机器人将为人类处理更多复杂或重复性的工作,现有研究人员发展出可设计、制造机器人的机器人。 在信息科技上,数位权利管理愈来愈受重视,以便保护知识财产,由全录公司Palo Alto研究中心创出的Content Guard公司,利用加密技术保护知识财产。 资料发掘与生物测定学也很有潜力,數據挖掘是利用数学演算法,在庞大的资料库中寻找方式,例如目前应用在掌纹、脸孔等图像辨识,或者是语言辨识处理等方面。 塑料芯片也是一大突破,在IBM、朗讯、麻省理工、剑桥大学、Penn State大学都在研发塑料或有机物质芯片。 微光学技术,专家利用可反射光线的水晶、玻璃等物质,让光纤传输资料的速度,不会因为通过路由器、交换器时而降低速度。 微应用流体学方面:科学家正试图利用物理原则做实验,只利用极微量的水,加快原本需要费时费金钱的实验。加州理工学院的应用物理学家Stephen Quake,以微应用流体学发展了一套DNA分析装置,比传统的分析装置快。 Technology Review的编辑指出,微应用流体学将为生物科技大有帮助,就像当初电晶体提高了电子产品。 医药方面 Pain Control Problem: Detecting pain Subjective no direct measurement Clinical:Visual Analogue Scale(VAS) Where will cause the pain? Endoscope Operating room:ESWL;Prostate Post Op. :PCA ICU Cancer pain P φ A System PCA data mining management 化学方面 近年来,随着化学资料的大量积累和资料库的普遍使用,逐步认识到大量资料的利用是十分困难且不充分的,更具价值的规律性的信息和知识反而被隐蔽起来。因此,化学數據挖掘作为一种新的信息技术开始出现于电脑化学中。 这一技术的关键是用软件来从大量的化学资料中自动地发现新的不明显和有潜在应用价值的信息和知识,因此它也常常与资料分析和知识发现(Knowledge discovery)相紧密结合。 化学數據挖掘主要内容 Data cleaning Data reduction Feature detection Feature reduction Classifier and category detection Fraud detection Recognizing unusual patterns Novelty detection Construction of sample databases Knowledge discovery and rule detection from large databases 生物医学方面 背景 随着人类基因序列的解码,基因与各种疾病间之关联性的研究正逐渐受到重视,而相关之研究文献亦随之增多。 通过搜寻引擎等渠道,医学研究人员可以快速取得所需之信息,但也同时面临了资料过多的问题。 气象业务方面 背景 随着通信技术和电脑技术的发展,每天在气象通信网上传输越来越庞大的气象资料,对这些资料的存储、集成和应用的问题也就越来越突出。 资料仓库是电脑应用发展的必然产物。经过长期积累所形成的大量业务资料,是过去的真实活动记录。如何利用这些资料并在此后的决策中发挥效益,为决策分析和评估提供帮助,很长时期内都困扰着资料库的发展。 數據挖掘(Data Mining)的功能 对资料进行厚缩,给出它的紧凑描述。數據挖掘主要关心从资料泛化的角度来讨论资料总结。 建立一个分类函数或分类模型,该模型能把资料库的资料项目映射到给定类别中的某一个。 把一组个体按照相似性归成若干类别。使属于同一类别的个体之间的距离尽可能地 小

文档评论(0)

chenchena + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档