- 1、本文档共8页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
商务智能的考试重点
商务智能的基本概念(简答)
对工业界来说,商务智能是一类技术或工具,利用他们可以对大量的数据进行收集、管理、分析和挖掘,以改善业务决策水平,增强企业竞争力。对学术界来说,商务智能是一套理论、方法、和应用,通过他们可以快速的发现海量数据中隐含的各种知识,有效的解决企业面临的管理和决策问题,支持企业的战略实施。
2.商务智能系统的开发过程
识别业务需求识别信息需求
识别业务需求
识别信息需求
时间成本规划
详细的需求分析
数据定义
规划
数据仓库数据集市
数据仓库
数据集市
OLAP设计
数据挖掘设计
需求分析
需求分析
技术选择
技术选择
设计
设计
增强查询报表
增强查询报表
在线分析处理
数据挖掘算法
构建数据仓库
构建数据集市实现
构建数据集市
实现
在线分析处理和在线事务处理(简答)
在线事务处理
在线分析处理
用户
普通职员
管理人员和分析人员
功能
日常业务处理
决策支持
数据库设计
高度规范化
非规范化
数据处理
在线插入、删除、修改
批量加载和删除
使用方式
重复操作
即时的、图表形式的交互查询
执行单元
短的事务处理
复杂的查询
数据
当前的、细节的数据
历史的汇总数据
性能指标
事务吞吐量
查询响应时间
事务特性
并发控制和事务恢复很重要
并发控制和事务恢复不重要
决策支持系统的系统架构
(1)模型库管理系统主要用于管理决策所需的各种模型,例如财务、统计、预测以及管理等方面的定量模型,利用这些模型可以进行问题分析。用户利用该系统可以方便快捷的构建和操纵模型。系统提供对模型的分类、删除、复制等维护功能,可以将已有模型进行合并,以及对模型的执行情况进行跟踪、分析和评价,如对变量进行敏感度分析等。
(2)知识库管理系统提供知识的表示、存储和管理功能,用于支持定量模型无法解决的决策过程,帮助用户建立、应用和管理描述性、过程性和推理性知识。
(3)对话产生与管理系统主要负责用户与系统之间的交互。接受用户的输入,能够与数据库管理系统、模型库管理系统和知识库管理系统进行交互,以各种形式将结果返回给用户,提供图形用户界面以及可视化功能。
用户
用户
知识库管理系统
知识库
数据库管理系统
模型库管理系统
数据库
模型库
对话产生与管理系统
对话产生与管理系统
6.回归:回归方法中最常用的是线性回归,包括一元线性回归、多元线性回归以及非线性回归。线性回归方法不仅用于预测,也可以用作解释模型,以探寻变量之间的关系。另外还有回归树和模型树等模型。
7.回归系数的显著性检验:
回归系数的显著性检验可以采用t检验。对于每个回归系数bi(i=1,2,....k),显著性检验的两个假设分别为H0:bi=0和H1:bi≠0。若bi=0说明自变量xi的变化对因变量没有线性影响,即变量xi对因变量的影响不显著。为每个回归系数bi构造变量tbi如式所示:
式中cii是对矩阵C=(XTX)-1的对角线上的第i个值。
给定显著性水平α,查自由度为(n-k-1)的t分布表,得到tα(n-k-1),若tbitα(n-k-1),则拒绝假设H0,即回归系数bi显著。
在通过以上显著性检验之后,给定一个因变量位置的样本(xt1,xt2,...xtk)将其带入式^y=b0+b1xi+.......+bkxk中的各个自变量取值中就可以得到因变量的一个预测值。
8.回归树和模型树:都是通过自顶向下分而治之的思想,将训练集不断分割成子数据集来不断扩展树枝,当满足一定条件时停止树的生长。
9.聚类效果衡量方法:(概念)
凝聚度:是用于衡量簇内各对象紧密程度的常用度量。
分离度:用于衡量簇间各对象的相异程度。
轮廓系数:也是将凝聚度和分离度相结合的一种度量。
10.4类主要的数据预处理任务:(简答)
数据规范化
数据离散化
数据清洗
特征提取与特征选择
11.数据清洗的主要任务是数据缺失的处理、噪音数据的处理以及数据不一致的识别和处理。
填补数据缺失方法:将属于同一类的对象的该属性值的均值赋予此缺失值;还可以将其转换为分类问题或数值预测问题。
噪音的处理方法可以分为两类:一类是识别出噪音,将其去除;另一类是利用其他非噪音数据降低噪音的影响,起到平滑的作用。
12.多维数据模型(名):又称维度数据模型,由维度表和事实表两种类型的表构成。为了解企业内业务过程的绩效,通常可以通过多种度量指标加以衡量。对于每个度量,可以从多种视角和方位进行分析,这就是不同维度。度量通常是定量属性(还有数值型属性),存放于事实表中;维度属性综合起来限定了度量的取值粒度。
13.在线分析处理OLAP的定义:在线分析处理是一类软件技术,利用它可以使分析人员、管理人员以及主管从多种信息视角通过快速、一致和交互地访问数据,达到对数据的洞察。这些视角是从原始数据转换过来的,反映了企业的真实维度,易于被用户理
您可能关注的文档
- 名师工作室运作实施方案.doc
- 名词解析(真题).doc
- 名词解释及重点简答题.docx
- 名校集体备课材料-(直线与方程).doc
- 吉林省长春汽车经济技术开发区2016届九年级英语上学期教学质量跟踪测试(期中)试题一.doc
- 名词解释Adams.docx
- 高校负债衍生问题及其潜在影响研究…………王祖山叶芃范静慧.doc
- 高校贵重仪器设备年度效益评价表.doc
- 后勤集团-信息化建设情况汇报20151203.doc
- 向会议要效益课程讲义.doc
- 专题06 经济体制(我国的社会主义市场经济体制)-五年(2020-2024)高考政治真题分类汇编(解析版).docx
- 专题11 世界多极化与经济全球化-5年(2020-2024)高考1年模拟政治真题分类汇编(解析版).docx
- 专题03 经济发展与社会进步-5年(2020-2024)高考1年模拟政治真题分类汇编(浙江专用)(解析版).docx
- 专题09 文化传承与文化创新-5年(2020-2024)高考1年模拟政治真题分类汇编(北京专用)(原卷版).docx
- 5年(2020-2024)高考政治真题分类汇编专题08 社会进步(我国的个人收入分配与社会保障)(原卷版).docx
- 专题07 探索世界与把握规律-5年(2020-2024)高考1年模拟政治真题分类汇编(解析版).docx
- 5年(2020-2024)高考政治真题分类汇编专题06 经济体制(我国的社会主义市场经济体制)(原卷版).docx
- 专题11 全面依法治国(治国理政的基本方式、法治中国建设、全面推进依法治国的基本要求)-五年(2020-2024)高考政治真题分类汇编(解析版).docx
- 专题17 区域联系与区域协调发展-【好题汇编】十年(2015-2024)高考地理真题分类汇编(解析版).docx
- 专题01 中国特色社会主义-5年(2020-2024)高考1年模拟政治真题分类汇编(原卷版).docx
文档评论(0)