- 1、本文档共75页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
浙江大学城市学院 周苏 教授 4.1 数据库技术基础 4.2 数据仓库与数据挖掘 4.3 数据存储解决方案 4.2 数据仓库与数据挖掘 1992年,“数据仓库” (Data Warehouse,DW) 的概念被正式提出,数据仓库的研究和应用开始得到广泛的关注。在原有单一的数据库概念的基础上,逐渐演化出两种不同的数据组织体系结构,即数据仓库和原有的业务数据库。这两个概念在用户环境、支持技术、数据量以及使用范围等方面存在着许多不同。 假设公司管理者想了解上个月皮鞋销售的总收益额,那只需一个简单的查询操作即可,通过运用SQL或QBE (Query By Example,范例查询) 工具便能轻而易举地实现。但如果想要进一步了解“通过将实际销售额与预算额进行比较,进而与过去五年的同期销售状况比较,该公司在东南和西南地区,上个月销售了多少双黑色的42码皮鞋”的话,即使采用先进的技术,这项任务看起来几乎也是不可能的。 若真能为此建立一个QBE查询的话,那么就能为企业建立数据库环境打下良好的基础。这就是之所以那么多企业都选择构建数据仓库的原因。 首先,在业务数据库可能包含有所需信息时,这些信息并非是以有助于创建数据库内部商务智能,或运用各种数据操作工具创建商务智能的方式进行组织的;其次,若要建立该类查询,那么业务数据库很可能要支持每秒数百次的事务处理请求。在单击“开始”按钮完成此类查询时,这可不是随便就能做到的事情。 为了支持这种富有活力的、必要而且复杂的功能,许多企业都在建立数据仓库,同时提供数据挖掘工具。简单地说,数据仓库是创建商务智能过程中,继数据库技术之后进一步的发展 (超过数据库) 。数据挖掘工具是人们用于在数据仓库和商务智能推理过程中,支持决策、解决问题或创造竞争优势而挖掘有价值信息时所必需的工具。 4.2.1 数据库管理系统工具 人们用字处理软件可以创建并编辑文档,用电子表格软件可以创建并编辑工作簿,数据库环境中也与之类似。数据库相当于一个文档或一个工作簿,因为数据库与文档或工作簿一样都包含了信息。字处理和电子表格是处理文档与工作簿的软件工具,而处理数据库的软件系统就是数据库管理系统。 借助数据库管理系统 (DBMS) 就可以定义数据库的逻辑结构.,并对数据库中的信息进行存取和利用。DBMS有5个重要的软件组成部分 (见图4.11) : l) DBMS引擎。 2) 数据定义子系统。 3) 数据操作子系统。 4) 应用程序生成子系统。 5) 数据管理子系统。 DBMS引擎是DBMS中最重要的部分,它接收来自其他各个DBMS子系统的逻辑查询请求,并将逻辑查询请求转换成其对应的物理形式。换句话说,对数据库和数据字典的逻辑存取感觉上就像是在物理存储设备上进行的一样。另外,区分数据库环境中的逻辑视图和物理视图是十分重要的。信息的物理视图解决的是信息在硬盘之类的外存储设备上怎样进行物理排列、存储和读取;而信息的逻辑视图则是关注用户要如何排列和存取信息,以满足其特定的业务需求。 数据库和DBMS将信息的物理视图与逻辑视图隔离开,具有两大优越性。首先,DBMS能够完成所有的物理处理功能,作为数据库用户,只需把精力放在自己所需信息的逻辑结构上就可以了。其次,虽然数据库中的信息仅有一种物理视图,但不同用户在数据库中提取的信息逻辑视图却各不相同。这是因为根据不同业务的需求会以不同的方法处理逻辑视图。DBMS引擎能够处理任何一种形式的信息逻辑视图或逻辑查询,并将其转换成与之对应的物理结构。 1. 数据定义子系统 DBMS的数据定义子系统帮助人们在数据库中建立并维护数据字典,以及定义数据库中的文件结构。 创建数据库时,首先要利用数据定义子系统建立数据字典并定义文件的结构。这点与某些类似电子数据表格的软件区别很大。运用电子表格软件创建工作簿时,一开始就可以填入信息、定义公式和函数,但在数据库中却不能这样做。 在数据库环境中,开始输入信息之前必须要先定义数据的逻辑结构,输入信息相对而言是比较轻松的事情,而定义数据逻辑结构则比较麻烦。 无论何时,只要我们发现某一文件需要补充新的信息,就必须运用数据定义子系统在数据字典中添加新字段。同样,如果我们想在一个文件中删除所有记录的指定字段,也必须用数据定义子系统完成这件事情。 建立数据字典时,肯定要定义数据库将要包含的信息逻辑属性。信息的逻辑结构包括以下内容: 逻辑属性 举例 字段名称 客户编码、订单日期 类型 字符、数字、日期、时间等 格式 电话号码前是否要加区号? 缺省值 若未标明订单日期,则缺省值为当前日期 有效范围 订货数量能否超过8? 输入约束 输入订单时是否必须输入发货地址?能否输入空值? 可否重复 主关键字是不能重复的,但订货数量是否可重复? 根据所描述信息的类型适当增加或减少限制,这些也都
您可能关注的文档
- 信息与网络安全概论(第三版) 教学课件 作者 978 7 302 21524 0k CHD16.ppt
- 信息政策与法规 教学课件 作者 查先进 1绪论.ppt
- 信息政策与法规 教学课件 作者 查先进 2信息政策法规体系结构.ppt
- 信息政策与法规 教学课件 作者 查先进 3信息政策法规的制订.ppt
- 信息政策与法规 教学课件 作者 查先进 4信息技术政策法规.ppt
- 信息政策与法规 教学课件 作者 查先进 5信息网络政策法规.ppt
- 信息政策与法规 教学课件 作者 查先进 7信息必威体育官网网址与公开法律制度.ppt
- 信息政策与法规 教学课件 作者 查先进 8电子商务法.ppt
- 信息资源管理 本科信管专业 王学颖 第1章 信息资源和信息资源管理.ppt
- 信息资源管理 本科信管专业 王学颖 第2章 信息资源内容管理.ppt
文档评论(0)