第三章数据库与数据仓库解读.ppt

  1. 1、本文档共102页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据集中:数据集中在一个结点上。控制容易,结构、设计及维护简单,可靠性差,影响并发操作。结点多时,对系统性能影响较大。 数据复制:数据复制到多个接点上。自治性、可靠性高,响应速度快,提供并行处理能力。数据更新及控制复杂。 数据分片:数据被分为若干部分,即数据片,分布到不同结点,不重复。自治性、可靠性较高,响应速度快,提供并行处理能力。数据更新及控制复杂。全局应用的效率低。 数据分布设计策略 数据分片方式 水平分片 垂直分片 混合分片。 数据片相交,并分布在不同的结点。 数据分布设计策略 Local Area Network (LAN) Local Area Network (LAN) Local Area Network (LAN) 集中式数据库服务器结构 数据库服务器 特点: 便于管理控制、安全; 不可靠; 网络及服务器负荷大; 对实时、全时工作的系统及较分散的组织不太合适。 Local Area Network (LAN) Wide Area Network (WAN) Local Area Network (LAN) 复制分布式数据库服务器结构 数据库服务器-拷贝1 数据库服务器-拷贝2 特点: 减少网络及服务器负荷; 可实现负载平衡; 数据一致性问题突出,要求定期对数据进行复制—数据同步。 复制的间隔影响一致性与网络及服务器负荷大小。 Catalog Name BillingAddress …… Product Item Description Vendor …… Package Shipper Inventory Item Order Item Shipment Return Item Order Order Transaction Customer 发货部门用的数据 订货部门用的数据 Local Area Network (LAN) Wide Area Network (WAN) Local Area Network (LAN) 发货部门的数据库服务器 订货部门的数据库服务器 分解分布式数据库服务器结构 特点: 数据同步矛盾较小。 适合DB能够明确分解的应用系统。 总部 分公司-1 分公司-n 分公司-2 办事处1-1 办事处1-k 办事处n-1 办事处n-m 分销商A 分销商X … … … … 目录 价格 促销 销售 库存 客户 目录 价格 促销 销售 库存 销售 库存 目录 价格 促销 销售 客户 销售信息系统的数据分布 * ——本章结束—— 数据挖掘技术Data Mining: 一种决策过程,它利用AI、统计技术,高度自动化地分析企业原有的数据,作出归纳性的推理,从中挖出潜在的模式,预测客户行为,帮助决策者作出正确的决策。 Data Mining分析方法: 关联分析、分类分析、聚类分析、因果关系分析。 OLAP与数据挖掘技术 关联分析: 若两个或多个变量的取值之间存在某种规律性,就称为关联。关联可分为简单关联、时序关联、因果关联。关联分析的目的是找出数据库中隐藏的关联网/关联知识。 如:啤酒与尿布(简单),汽车与保险(时序)等等 因果关系分析: 关联分析的一种。 OLAP与数据挖掘技术 分类分析:反映同类事物共同性质和不同事物之间的差异性。最典型的分类方法是基于决策树的分类方法,其叶结点是类名,中间结点是带有分枝的属性。它从实例集中构造决策树。此外还有线性回归、粗糙集、神经网络等分类方法。 如客户分类:重要客户、一般客户、潜在客户。 客户属于重要客户. OLAP与数据挖掘技术 聚类分析: 数据库中的记录可被划分为一系列有意义的子集,即聚类。 聚类分析不需要事先定义类,而是挖掘算法根据数据的相似度和差异度自动归类。通常通过聚类的结果,发现各类的特征。 OLAP与数据挖掘技术 用户界面 Data Warehouse Database Files Other Data Sources Data Mining核心 Data Mining 系统结构 Knowledge Base Data Mining 分析方法 ODBC,JDBC, 或其他Database接口 Open API 开放应用程序接口 数据源 数据挖掘工具 DATA MINING TOOLS 用于查询数据仓库中的信息的软件工具。 查询与报表工具QUERY-AND-REPORTING TOOLS:QBE tools, SQL, and report generators. 智能代理INTELLIGENT AGENTS :一种人工智能artificial intelligence工具, 是OLAP 信息发掘“information discovery”的基础。 多维分析工具MULTIDIMENSIONAL ANALYS

文档评论(0)

shuwkb + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档