SSIS关键元素的使用.ppt

  1. 1、本文档共47页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
SSIS关键元素的使用

* 2、在“平面连接管理器”窗口中切换到“高级”页面配置各列的属性。这里可以设置各列的名称和长度等属性。此处应该按照前面创建表的SQL语句设置数据的字段类型,否则在后面数据导入的时候会由于字段类型的不匹配而发生错误。 另外,因为需要保存无效的客户数据,还要创建一个连接指向保存这些数据的文本文件,将此连接命名为CustomersWithInvalidTerrritoryID。 * * * (四)设计数据流 双击控制流中的“数据清洗和加载”数据流任务 组件,切换到数据流编辑器。 1、把“平面文件源”组件拖动到数据流编辑器中,改名为“数据提取”,按下图所示进行设置。 * 2、选择“条件性拆分”组件,命名为“按照TerritoryID拆分数据”,并将数据流从上一步创建的“数据提取”文件源中指向这个条件性拆分组件。 3、双击条件性拆分组件,在“条件性拆分转换编辑器”中,展开左上角的列对象,把Territory字段拖动到网格中的“条件”列,同时编辑“条件”列表达式为“[Territory]==1”。为了使操作的结果更直观,可以把输出名称改为“区域1”。其他的条件列可以进行相应的设置。默认输出名称改为“无效区域”。最终结果如下图所示。 * * 4、拖动4个“OLE DB目标”组件到数据流编辑器中作为条件拆分后数据的归宿目标。把数据流从条件拆分组件连接向数据目标时,会弹出“选择输入输出”对话框。选择需要的输出,数据流就创建好了。 * 5、切换到控制流执行容器,在数据库中创建表。编辑OLE DB目标,使其指向前面用SQL语句创建的目标表。如下图所示。 注意:如果前面对Customers数据连接的设置中数据类型没有设置正确描绘出现错误提示:列“FirstName”无法在 unicode 和非 unicode 字符串数据类型之间转换。 返回Customers数据连接,重新编辑其字段的属性即可。 * * 6、设置无效区域目标文件,指向CustomersWithInvalidTerrritoryID平面文件连接。 * * 7、在条件拆分中还有区域2的数据没有目标宿主,这是因为销售区域2在数据录入的时候邮编本应该是5位,而有些数据由于省略了前面的0只输入了4位数字,因此还需要对邮编进行清洗操作才能导入到表中。选择“派生列”组件,按下图进行设置。在表达式中输入代码: LEN(PostalCode) == 4 ? 0 + PostalCode : PostalCode ,含义是如果PostalCode字段的长度为4,则在前面加0,否则直接使用PostalCode作为目标列的值。通过这种方法对数据进行了有效的清洗。 * * 8、将区域2的目标添加到数据流设计器中,并与派生列组件连接起来。 * * 五、包的部署 要使包能在不同的环境下完成ETL的功能,必须把包含包的项目生成部署实用工具,然后安装包安装向导将包安装到文件系统或安装到SQL Server2005的实例中。 (一)部署实用工具的使用 1、在解决方案资源管理器中鼠标右键单击该项目,在弹出的快捷菜单中选择“属性”命令。在“项目名称属性页”对话框中,单击“部署实用工具”选项,按下图所示设置。 * 2、在解决方案资源管理器中,用鼠标右键单击该项目,在弹出的快捷菜单中选择“生成”命令。在“输出”窗口中可以查看生成进度和生成错误。 (二)将包部署到文件系统 打开部署文件夹,找到清单文件,如alldemo项目的清单文件为alldemo.SSISDeploymentManifest,用鼠标双击,启动包安装向导。 * SSIS关键元素的使用 * 第三讲(2) 在前面创建包的过程中,用到了任务、容器、数据源和目标,以及转换等SSIS元素。其中,任务有数据流任务和文件系统任务,它们分别完成数据流控制和将文件复制到备份文件夹;容器组件则用到了序列容器,作用是把数据流和文件系统任务打包成一个整体;数据源主要是OLE DB源,即数据流中的第一个组件,其作用是从AdventureWorks数据库的“TransactionHistoryArchive”表中加载归档销售事务数据。firstSSIS包中使用了4个转换组件来完成数据流中数据的转换,第1个是名为“计算每一项的总成本”的派生列转换,它通过将每个销售事务的成本与数量相乘并将其结果存储在创建的新列中;第2个是聚合转换(汇总数量和成本),它按“ProductID”列对数据进行分组,并且对于每一个“ProductID”都计算其“Quantity”列的和作为“QuantitySum”列,同时计算“LineItemTotalCost”列的和作为“TotalCostByID”列; * 第3个转换也是一个派生列转换组件,其作用是计算平均成本并且存储在一个新列中;最后,系统还用到了排序

文档评论(0)

2266670 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档