网站大量收购独家精品文档,联系QQ:2885784924

数据挖掘项目实施中的重要规范建模规范-Read.PPT

数据挖掘项目实施中的重要规范建模规范-Read.PPT

  1. 1、本文档共123页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据挖掘项目实施中的重要规范建模规范-Read

公司介绍 华策辉弘科技有限公司致力于商业数据分析的咨询服务,由具备丰富的国际、国内项目经验的国内外资深专家创办。公司有一支业界不多见的高水准咨询服务专业团队,项目的经验覆盖亚洲太平洋地区包括中国、澳洲、香港、泰国、马来西亚等地的金融业、电讯业以及零售业,为这些不同国家和不同行业的客户提供商业信息及分析性解决方案。 公司介绍 华策辉弘科技有限公司 历史 1997 – 2002, 共同创始人 Eric 工作于SAS中国,Dick工作于SAS香港 2002 – 2004, 独立进行咨询顾问工作 2004 – 2006, Eric在北京创建了华策未来, Dick在香港创建了万讯奥义 2006 – 至今, 在深圳合并,成立了华策辉弘 业务范围 关于决策支持系统/客户关系管理/数据挖掘/信用评分/分析的咨询项目,其主要客户是金融业和通讯行业 基于SAS工具的数据处理和分析的开发服务 提供针对SAS 编程人员/分析师/设计师的培训 团队成员 核心团队成员大都拥有超过八年以上有关各项服务的经验﹐同时具备应用SAS软件八年以上的经验﹐在银行业、电讯业与保险业也有丰富的行业经验, 所担任的角色分别从市场分析及报告到风险评估及管理。团队成员曾经夺得第二届国际智能数据分析比赛冠军。专家团队中有来自英国皇家统计学会的注册统计师。 团队成员在亚太地区及澳大利亚的各行业中的经验 团队成员在亚太地区及澳大利亚的各行业中的经验 电讯行业 中国移动有限公司 中国联通有限公司 澳洲Optus电讯有限公司 香港电讯(PCCW)有限公司 香港和记黄埔有限公司 香港和记环球电讯有限公司 香港数码通移动通讯有限公司 泰国电讯有限公司 泰国AIS电讯有限公司 马来西亚Maxis电讯有限公司 团队成员在亚太地区及澳大利亚的各行业中的经验 保险业 澳洲MBF保险, 澳洲苏黎世保险 零售业 百佳超级市场, 加德士澳洲有限公司 政府部门 香港特别行政区统计处, 香港贸易发展局 中国海关总署 公司介绍 华策辉弘科技有限公司 更多信息: 请访问公司网站 或者与我们联系: +86 755 3336 1183 主题 数据挖掘概述 数据挖掘实施方法论 数据挖掘项目实施流程 专题1:业务目标选定 专题2:数据挖掘项目评估方法 专题3:数据挖掘项目管理 专题4:数据挖掘项目实施中的重要规范 现实世界中的数据挖掘可以用来干什么? —— 有哪些信誉好的足球投注网站制造爆炸的恐怖分子 现实世界中的数据挖掘可以用来干什么? —— 谁会同意扩大军费开支? 就象解谜语一样, 数据挖掘从大量复杂的数据中发现直接有效的信息和知识. 数据分析的最初 数据分析能力受到计算能力和存储能力的限制. 1959年,IBM大型机7090, 0.5 MHz 处理器 0.2 MB内存! 一个600行,4列的数据集需要约3000张打孔卡片! 分析时,一次同时考虑的变量最多达到25个! 促进数据挖掘发展的要素 数据 —— 大量的,运营型数据 用户和需求 ——业务决策支持的需求 技术和方法 —— 计算能力的飞速发展 —— 多学科领域研究的发展 数据 数据洪水已经来临: 大量的数据在产生: 金融、电信以及其它行业的交易数据 科学实验数据:天文、空间探索、生物及高能物理等 Web 数据:文字、图像及其它多媒体格式 拥有16个望远镜的欧洲长基线干扰仪在25天的观察期中每秒钟产生1G数据 2003年,法国电信的呼叫数据为30TB,ATT以26TB的数据量位居第二,如此多的呼叫数据以致于ATT无法全部保存,对数据的分析也只能是“粗略”的 Google,40亿以上的页面(2004年4月统计),数据量为nTB 据加州大学伯克利分校的研究人员统计,2002年新产生数据为1999年的2倍,而且数据的膨胀在不断加速 用户和需求: 对于复杂现象的简单结论 市场 – 谁将会购买这个产品? 预测 – 我们将面临何种需求? 忠诚度 – 谁最有可能流失? 信用 - 哪一类人群不还款的倾向严重? 欺诈 - 什么时候会发生? 用户和需求 技术和方法—— 计算能力的飞速发展 技术和方法—— 多学科领域研究的发展 广泛的商业需求,需要出现一种挖掘数据背后隐藏的知识的手段。 1989年8月在美国底特律召开的第11届国际人工智能联合会议的专题讨论会上首次出现知识发现(KDD)这个术语,数据挖掘(DM)是知识发现(KDD)中的一个特定步骤和核心技术 数据挖掘的研究重点逐渐从发现方法转向系统应用,注重多种发现策略和技术的集成,以及多种学科之间的相互渗透,现在已经成为一个自成体系的应用学科。 什么是数据挖掘?

文档评论(0)

zhuwo + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档