数据仓库ETL实现过程.doc

  1. 1、本文档共34页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据仓库ETL实现过程.doc

数据仓库与ETL的实现过程 一、抽取维度表 (一)抽取维度表DimEmp 依次打开Satrt|All program|Microsoft SQL Server 2008| Microsoft SQL Server? Business Intelligence Development Studio。 依次打开File|New|Project,Integration Services Project,命名为ToDW,保存位置为C:\Documents and Settings\Administrator\Desktop\课程\练习\第2课,然后点击OK。 在Solution Explorer中选中SSIS Packages ,单击右键选择新建SSIS包。选中新建的包,右键单击选择rename,然后输入Dim.dtsx 。点击空白处显示如下提示框,点击Yes。 双击新建的SSIS包,即Dim 在General 中的Name后输入:truncate table EMP Product 。 点击选中Connection然后 点击向下的箭头,选择New Connection出现如下对话框: ○在Server name ○Connect to database中选择Select or enter or database name ,在下拉菜单选择 HealthDW。 点击Test Connection ,显示Test Connection succeeded 对话框即: 然后点击OK关闭此信息框。 点击OK 关闭Connection Manger对话框。 在Data connection 中,选中LOCALHOST .HealthDW,然后点击OK关闭Configure OLE DB Connection Manager 对话框。 在对话框中输入以下语句: use HealthDW truncate table DimEmp dbcc checkident(DimEmp,reseed,1) truncate table DimProduct dbcc checkident(DimProduct,reseed,1) 点击OK关闭Enter SQL Query对话框。 点击OK关闭Excute SQL Task Editor 在Toolbox面板中将Data Flow Task 拖到Control Flow窗体中,并拖动truncate table EMP Product下面的绿色箭头连接到Data Flow Task上。 选中Data Flow Task后单击,将其重命名为DimEmp。 双击DimEmp,然后在Toolbox面板中将Excel Source 拖到Data Flow 窗体中。 选中Excel Source后单击,将其重命名为:店面——销售一组,并双击它出现如下图示: 选择OLE DB connection manager 右边的New 出现Excel Connection Manager对话框,如下图所示: 在Excel file path 中点击Brower,浏览Excel数据源所在位置C:\Documents and Settings\Administrator\Desktop\课程\快速入门\第2课:数据仓库与ETL的实现过程\工程文件\ToDW\DataSource\Store sales.xlsx。出现如下图示: 然后点击OK关闭Excel Connection Manager对话框。 在Data access mode 中选择SQL command;在SQL command text中输入:select distinct EmployName,GroupName from [sheet1$] where EmployName is not null 在Toolbox面板中将Derived Column拖到Data Flow 窗体中,选中Derived Column重命名为:DeptName。 拖动店面——销售一组下面的绿色箭头到DeptName上。 双击DeptName后,加入 DeptName列,在 expression中输入”店面”,然后点击OK。具体操作如下图所示: 在Toolbox中将OLE DB Source 到Data Flow中,重命名为Pos。 双击Pos出现下图: OLE DB connection manager 中选择New,出现configure OLE DB Connection Manager对话框 ,然后点击New 出现Connection Manager对话框LE DB Provider。 然后点击Data Links,出现Data Link Propert

文档评论(0)

ygeorcgdw + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档