- 1、本文档共15页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据仓库建模技术
曹 翊
2002 年9 月
数据仓库之路原创资料
数据仓库建模技术
一、 数据仓库建模的原则
模型是对现实事物的反映和抽象,它可以帮助我们更加清晰的了解客观世界。数据仓库建模
在业务需求分析之后开始,是数据仓库构造工作正式开始的第一步,正确而完备的数据模型
是用户业务需求的体现,是数据仓库项目成功与否最重要的技术因素。
金融企业的信息系统具有业务复杂、机构复杂、系统庞大的特点,因此金融行业数据仓库建
模必须注意以下几个方面,
—— 满足不同用户的需求
金融行业的业务流程十分复杂,数据仓库系统涉及的业务用户众多,在进行数据模型设计的
时候必须兼顾不同业务产品、不同业务部门、不同层次、不同级别用户的信息需求。
数据仓库应该支持企业的各种业务,比如对财产保险行业应该考虑财产险、货物运输险、工
程险、责任险等不同业务的特点;不同的业务部门对信息的需求各有不同,应考虑业务、市
场、财务、管理等各个部门的需要;不同层次的组织所关心的信息不同,数据模型应支持地
市公司、省公司和总公司的信息需求;金融企业是知识密集型的企业,知识密集型企业的显
著特征是智能员工(Knowledge Worker) 占企业员工的大多数,数据仓库必须支持所有相关智
能型员工的信息需求,包括高层领导、基层领导和普通员工。
—— 兼顾效率与数据粒度的需要
数据粒度和查询效率从来都是矛盾的,细小的数据粒度可以保证信息访问的灵活性,但同时
却降低了查询的效率并占用大量的存储空间,数据模型的设计必须在这矛盾的两者中取得平
衡,优秀的数据模型设计既可以提供足够详细的数据支持又能够保证查询的效率。
—— 支持需求的变化
用户的信息需求随着市场的变化而变化,所以需求的变化只有在市场竞争停顿的时候才会停
止,而且随着竞争的激化,需求变化会越来越频繁。数据模型的设计必须考虑如何适应和满
足需求的变化。
—— 避免对业务运营系统造成影响
金融企业的数据仓库系统是一个每天都在长大的庞然大物,它的运行很容易占用很多的资
- 1-
数据仓库建模技术
源,比如网络资源、系统资源,在进行数据模型设计的时候也需要考虑如何减少对业务系统
性能的影响。
—— 考虑未来的可扩展性
数据仓库系统是一个与企业同步发展的有机体,数据模型作为数据仓库的灵魂必须提供可扩
展的能力,在进行数据模型设计时必须考虑未来的发展,更多的非核心业务数据如人事数据、
市场数据、竞争对手数据等必须可以方便的加入到数据仓库,而不需要对数据仓库中原有的
系统进行大规模的修改。
- 2-
数据仓库建模技术
二、 数据模型的技术功能结构化分
大规模的数据仓库系统特别是金融行业数据仓库的数据结构从技术角度划分应当包含三个
部分,如下图所示,
数据仓库数据模型的技术功能划分
2.1 分段存储区(Staging Area)
由于数据仓库中的数据结构和组织方式具有很大差异、所有原始业务系统的数据必须经过严
格的抽取、映射和转换,数据的整合过程十分复杂,通常会耗费比较长的处理时间。如果从
业务系统直接抽取数据到数据仓库,必定会占用许多业务系统的资源和时间,为了避免影响
业务系统的运行,我们在数据模型的设计中引入分段存储区的概念。
分段存储区(StagingArea)是为了保证数据移动的顺利进行而开设的阶段性数据存储空间,
它是业务系统原始数据进入数据仓库前的缓存区。需要进入数据仓库的各个业务系统的数据
首先直接快速传输到分段存储区,再从分段存储区经过清洗、转换、映射等复杂的数据移动
处理转移到目标数据仓库中。从业务系统到分段存储区的数据传输,应尽量
您可能关注的文档
- 我国纯碱工业分析及未来发展趋势研究.pdf
- ibm商业模式分析.pdf
- 呼叫中心电话营销方案.pdf
- 媒体广告有限公司设计文案职责规范.pdf
- 基金公司激励方案.pdf
- 集体谈判的程序.pdf
- 岗位轮换管理办法.pdf
- 山西天柱山化工有限公司锅炉烟气氨法脱硫装置操作手册.pdf
- BS7799标准及其在中观信息系统审计中的运用.pdf
- 从江洛贯产业承接区调研报告.pdf
- 2024年浙江教师招聘-台州湾新区招聘学科老师14人笔试备考题库及答案解析.docx
- 2024年下半年新疆阿克苏地区引进急需紧缺人才(302人)笔试备考题库及答案解析.docx
- 2024年浙江教师招聘-绍兴上虞区谢塘镇中心幼儿园教师招聘若干人笔试备考题库及答案解析.docx
- 2024年下半年成都市郫都区卫生健康局所属事业单位公开招聘大学生乡村医生(2人)笔试备考题库及答案解析.docx
- 2024年下半年成都市发展和改革委员会所属1家事业单位公开招聘2名工作人员笔试备考题库及答案解析.docx
- 2024年下半年成都市温江区面向社会考核招聘教师(2人)笔试备考题库及答案解析.docx
- 2024年铜陵市利业职业技能培训学校招聘2人笔试备考题库及答案解析.docx
- 2024年上海体育科学研究所(上海市反兴奋剂中心)第二轮公开招聘笔试备考题库及答案解析.docx
- 2024年上海文化广场第三季度公开招聘工作人员笔试备考题库及答案解析.docx
- 2024年武汉市江岸区育才寄宿实验小学招聘5人笔试备考题库及答案解析.docx
最近下载
- 2024年部编版四年级上册语文大单元作业设计第二单元作业单.pdf VIP
- 美国Megger IDAX300-350绝缘诊断分析仪使用说明书.pdf
- 六年级语文上册1-2单元测试(原卷+答案)2023-2024学年 部编版.docx
- 重油催化裂解增产丙烯研究进展.doc VIP
- 《食品添加剂应用技术》第二版 课件 任务4.2 增稠剂的使用.pptx
- 2023全国青少年文化遗产知识大赛题库附答案(401 -600 题).docx
- 双减背景下新课标单元整体作业分层设计案例 人教版初中英语八年级上册 Unit 1 Where did you go on.docx
- 《哈利波特》书籍分享ppt课件(图文).pptx
- 2.2 中国的气候第1课时 气候复杂多样教学设计 2023-2024学年湘教版地理八年级上册.docx
- 《中国特色社会主义道路的开辟与发展》参考课件.pptx VIP
文档评论(0)