- 1、本文档共5页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
利用SQL Server 2005创建数据仓库
利用SQL Server 2005创建数据仓库
1.原始业务数据分析
打开配套的foodmart.mdb文件的教学资料栏目中下载),可以看到如图3.所示的24张表虽然以前在设计这个数据库的时候加入了数据仓库的某些特点,但由于它本身源于以前的系统,也存储了全部的业务数据,因此这里作为初学可以把它理解为福马特商店的原始数据。
图3.福马特商店的业务数据在这个数据库中,包含了福马特商店日常经营业务的数据,如人事管理中的员工信息存储在employee表中,员工所属部门信息存储在department表中,职务信息则存储在position表中,库存管理业务中的仓库类型存储在warehouse_class表中,具体的仓库存储在warehouse中。
2设计数据仓库逻辑模型
福马特市场部的商务需求是要对1998年进行的所有销售业务数据进行多角度分析,以便市场分析人员能在查询数据库时获取快速的响应,高层管理人员也能从总体上把握影响本年度销售的因素。这需要利用存储在公司业务数据库中的数据建立数据仓库,进而创建可用于分析的多维数据结构。
这里只着眼于销售方面的数据,因而把与销售相关的表提炼出来进行分析。在foodmart.mdb数据库中,销售业务的数据和时间、促销手段、产品和店铺等都有关系,它们的关系体现在表与表之间的逻辑关系上。要从业务数据出发设计数据仓库的结构,必须明确业务数据本身的结构,而业务数据的关系一般基于关系数据库设计的范式。数据仓库中表的关系不受关系数据库设计范式的约束,但也要遵循一定的结构规范,如星型结构和雪花模型结构即是这种类型的规范同时也是数据仓库逻辑结构的两种类型。
这里希望用雪花模型结构来构建福马特商店的销售数据仓库,逻辑结构设计如图3.所示。
在数据仓库的逻辑结构中,数据表可以划分为两类:一类是事实数据表,用来存储数据仓库中的实际数据,如这里存储1998年销售数据的sales_fact_1998表;另一类是维度数据表,用来存储数据仓库中的维度数据,如这里的关于时间、促销手段和产品等分析要素的表。
原始数据的特点在本例中设计的维度表和事实表与原始数据中的表名及结构都一致。在实际设计的时候,通常需要根据需求情况重新建立与原始数据不同的表结构。这主要是传统业务的数据库是用来进行事务处理的(即OLTP),而数据仓库则是用来进行分析处理的(即OLAP),用途的不同决定了其结构的不同。
图3.销售数据仓库雪花模型结构设计图3.创建foodmartsaleDW数据仓库
数据仓库也是一种数据库,其管理同样是通过数据库管理系统来进行的。因此数据仓库可以像普通数据库一样进行创建、修改和删除。当数据仓库的逻辑结构设计完后,就可以创建物理数据仓库了。
这时可以在SQL Server Management Studio中按照一般的建立数据库的方法建立一个名为foodmartsaleDW的数据库,然后把这里设计的表创建好,数据类型依据原始数据库中各个表和字段的数据类型设置。由于这里数据仓库表结构与原始数据库中的表结构基本一致,因此,创建foodmartsaleDW数据仓库的物理结构过程也可以在ETL阶段完成。
设计和使用ETL
数据仓库的设计可以说是数据分析和商业智能最基础的工作。良好的数据仓库结构设计是以后工作能顺利进行的保证而数据仓库中的数据则一般要经过提取转换加载的过程从原始业务数据中获取,这就是ETL过程。
这里的任务就是要把数据从foodmart.mdb数据库中装载到foodmartsaleDW数据仓库中。需要用到SQL Server Integration Services服务,即SSIS,其操作步骤如下。
(1) 打开Business Intelligence Development Studio,选择文件→“新建→“项目命令,弹出新建项目对话框,展开商业智能项目,在模板窗格中Integration Services项目,把项目命名为foodmartsale ETL,如图3.所示。
这时会在BI Studio环境中打开用于设计SSIS的各种工具和窗口,数据提取、转换和加载的操作都在这个界面下进行。
(2) 选择项目SSIS导入和导出向导命令,这时会弹出SSIS导入和导出向导的欢迎界面,单击下一步按钮。
(3) 在选择数据源窗口中的数据源下拉列表中选择Access数据源,如图3.所示。然后在中选择此项目文件夹中的foodmart 2000.mdb文件。
图3.创建foodmartsale ETL项目
图3.选择foodmart 2000.mdb数据源
(4) 在随即的窗口中选择数据的导出目标,这里选择SQL Native Client,如图3.所示。设置好服务器及其登录信息后,选择foodmartsaleDW数据仓库作为目标数据库,如果在
您可能关注的文档
- 儿童青少年肥胖-20104112353.ppt
- 健身运动小游戏策划3.doc
- 光学工程讲义16-PHOTODETECTORS.ppt
- 光影的交响1.ppt
- 做最有用的好员工19节.doc
- 光源与灯具1.ppt
- 光弹3╱实验力学课件.ppt
- 光的反射练习003.doc
- 光电技术试题及答案1.doc
- 光油、哑油MSDS14.doc
- 中国国家标准 GB/T 18233.4-2024信息技术 用户建筑群通用布缆 第4部分:住宅.pdf
- GB/T 18233.4-2024信息技术 用户建筑群通用布缆 第4部分:住宅.pdf
- GB/T 18978.210-2024人-系统交互工效学 第210部分:以人为中心的交互系统设计.pdf
- 《GB/T 18978.210-2024人-系统交互工效学 第210部分:以人为中心的交互系统设计》.pdf
- 中国国家标准 GB/T 18978.210-2024人-系统交互工效学 第210部分:以人为中心的交互系统设计.pdf
- GB/T 16649.2-2024识别卡 集成电路卡 第2部分:带触点的卡 触点的尺寸和位置.pdf
- 《GB/T 16649.2-2024识别卡 集成电路卡 第2部分:带触点的卡 触点的尺寸和位置》.pdf
- 中国国家标准 GB/T 16649.2-2024识别卡 集成电路卡 第2部分:带触点的卡 触点的尺寸和位置.pdf
- GB/T 17889.4-2024梯子 第4部分:铰链梯.pdf
- 《GB/T 17889.4-2024梯子 第4部分:铰链梯》.pdf
文档评论(0)