微软数据仓库介绍解读.pptx

  1. 1、本文档共16页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
Module 1 Introduction to Data Warehousing Module Overview 数据仓库概述 考虑数据仓库解决方案 Lesson 1: 数据仓库概述 商业难题 什么是数据仓库? 数据仓库架构 数据仓库解决方案组件 数据仓库项目 数据仓库项目角色 SQL Server 作为数据仓库平台 业务难题 关键业务数据分布在多个业务系统 找到业务决策的信息是耗时的和容易出错的 基本的业务问题很难回答 What Is a Data Warehouse? 一个集中存放用于报表和数据的信息容器 通常,一个数据仓库: 包含大量的历史数据 优化了数据查询 (而不是插入和更新) 定期加载新的业务数据 为企业商务智能解决方案提供依据 Data Warehouse Architectures Components of a Data Warehousing Solution 从业务系统和其他数据源抽取数据加载 数据通常最终加载到数据仓库 数据清洗和重复数据的删除,确保数据仓库中数据的质量 MDM 提供确切的业务数据实体 Data Warehousing Projects 首先确定数据仓库需要解决的业务问题 确定回答这些问题所需的数据 识别所需数据的数据源 评估关键业务目标价值可行性,从现在的数据回答每个问题 对大量数据的项目, 使用增量更新比较有效: 把项目分解为多个子项目 每个子项目处理一个特定的主题 Data Warehousing Project Roles Project manager Solution architect Data modeler Database administrator Infrastructure specialist ETL developer Business users/analyst Testers Data stewards SQL Server As a Data Warehousing Platform SQL Server Database Engine Microsoft SQL Server Integration Services SQL Server Master Data Services Microsoft SQL Azure and the Windows Azure Marketplace Microsoft PowerPivot Technologies Microsoft Excel Data Mining Add-In PowerPivot Add-In MDS Add-In Power View Reports, KPIs, and Dashboards Interactive data visualizations Interactive data analysis Data Warehousing Business Intelligence Lesson 2: Considerations for a Data Warehouse Solution Data Warehouse Database and Storage Data Sources Extract, Transform, and Load Processes Data Quality and Master Data Management Data Warehouse Database and Storage 考虑数据仓库包括: Database schema Logical: typically denormalized for optimal read performance Physical: often partitioned for performance and management Hardware Query processing and memory Storage Network High availability and disaster recovery Hardware redundancy Backup strategy Security Server access Data permissions Data Sources 数据源连接类型 凭证和权限 数据格式 数据采集窗口 Extract, Transform, and Load Processes 临时表: 存放临时数据 所需的转换: 提取数据时所需的数据转换和清洗 增量 ETL: 数据的变化加载 Data Quality and Master Data Management Data quality: Cleansing data: Validating data values Ensurin

文档评论(0)

shuwkb + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档