数据挖掘-学者网.PPT

  1. 1、本文档共77页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据挖掘-学者网

(5) 离群点(Outlier)检测 离群点检测就是发现与众不同的数据。 可应用于商业欺诈行为的自动检测,网络入侵检测,金融欺诈检测,反洗钱,犯罪嫌疑人调查,海关、税务稽查等。 (6) 演化(Evolving)分析 演化分析就是对随时间变化的数据对象的变化规律和趋势进行建模描述。如商品销售的周期(季节)性分析。 * Web结构挖掘:挖掘Web上的链接结构,即对Web文档的结构进行挖掘。通过Web页面间的链接信息可以识别出权威页面、安全隐患(非法链接)等。 Web使用挖掘:通过对用户访问行为或Web日志的分析,获得用户的有用模式,建立用户兴趣模型。分析和发现Log日志中蕴藏的规律可以识别潜在客户、跟踪Web服务的质量以及侦探非法访问的隐患等。 Web内容挖掘:对Web页面内容及后台交易数据库进行挖掘,Web内容挖掘与文本挖掘(Text Mining)和Web有哪些信誉好的足球投注网站引擎(Search Engine)等领域密切相关。 * (3) 自动问答系统 自动问答系统Q/A(automatic Question Answering) 采用自然语言处理技术,一方面完成对用户疑问的理解;另一方面完成正确答案的生成。这些研究涉及到计算语言学、信息科学和人工智能学,是计算机应用研究的热点之一,其核心是自然语言理解技术。 如:Lexxe wolfrram Baidu知道,维基百科(Wikipedia)等利用群体智慧来部分实现自动问答的功能。 注:在2011年2月14日至16日举行的有史以来首次广义性人机智力大赛中,IBM超级电脑“沃森”(Watson)击败美国颇受欢迎的智力竞赛节目Jeopardy中的两位最成功的参赛者肯-詹宁斯(Ken Jennings)和布拉德-鲁特(Brad Rutter)。 * (4)网络游戏:网络游戏外挂检测、免费用户到付费用户的转化 在网络游戏中,游戏外挂是对游戏运营商最严重的危害之一。所谓网络游戏的外挂是指玩家利用游戏本身玩法的漏洞或通过作弊程序改变网络游戏软件。 网络游戏正式运营前会存在大量的注册用户,这些注册用户会在网络游戏运行后存在很长一段时间。如何把这些注册用户转化成付费客户,真正为游戏运营商带来收益呢?数据挖掘技术的应用使网络游戏运营商能够对注册用户采取差别化营销,对正确的注册用户采用合适的营销手段,从而提高市场营销活动效果,使企业利润得到最大化。 * 1.4.3 其它领域中的应用 生物信息或基因数据挖掘 情报分析挖掘 体育竞赛 天文学 过程控制/质量监督保证 …… * 数据挖掘不能干什么 虽然数据挖掘具有广泛应用,但它绝不是无所不能,首先数据挖掘仅仅是一个工具,而不是有魔力的权杖;其次数据挖掘得到的预言模型可以告诉你会如何(what will happen),但不能说明为什么会(why);再者数据挖掘不能在缺乏指导的情况下自动地发现模型。 * 1.5 数据挖掘技术的前景、研究热点 数据挖掘技术的价值和前景 数据挖掘的研究热点 数据挖掘未来发展 * 数据挖掘技术的价值和前景。 2000年Gartner Group的一次高级技术调查将数据挖掘和人工智能列为“未来三到五年内将对工业产生深远影响的五大关键技术”之首,并将并行处理体系和数据挖掘列为未来五年内投资焦点的十大新兴技术前两位。(目前,在对产业界具有深远影响的大型IT公司里,数据挖掘技术发挥着重要作用,如Microsoft、Google、Yahoo、Baidu、Tencent等国内外著名IT公司)。 2005年微软将“互联网有哪些信誉好的足球投注网站、数据挖掘与语音技术”确定为亚洲研究院的3大研发领域之一。微软的Excel嵌入了数据挖掘功能XLMiner,SQLServer2005增加了数据挖掘功能。 美国2008年评选的12个最有前途的职业中数据挖掘师排名第四。 包括IBM在内的世界上主要数据库厂商,纷纷在数据挖掘领域加大投入,把数据挖掘功能集成到其产品中,以提高产品的竞争力。2009年10月2日,IBM 成功收购了SPSS Inc。 * (1)数据流挖掘 通信领域中的电话记录数据流、Web上的用户点击数据流、网络监测中的数据包流、各类传感器网络中的检测数据流、金融领域的证券数据流、卫星传回的图像数据流以及零售业务中的交易数据流等形成了一种与传统数据库中静态数据不同的数据形态——数据流。 数据流实时、连续、有序、快速到达的特点以及在线分析的应用需求,对流数据挖掘算法提出了诸多挑战,其中最主要的挑战是使用小的存储空间和少的运行时间快速地进行必要的处理,传统的处理方法难以满足这种要求。 研究热点 * (2)文本挖掘 文本挖掘是近几年来数据挖掘领域的一个新兴分支,

文档评论(0)

2105194781 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档