数据挖掘与分析1..doc

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据挖掘与分析1.

《数据挖掘与分析》自测题A (时间为120分钟) 一、填空题(每题2分,共20分) 1、数据的上四分位数表示:大体上整批数据的 %的观测值不超过上四分位数。 2、利用正态图可以作直观的正态性检验,若正态图上的点 ,可以认为样本数据来自正态总体。 3、概括地讲,一个检验的值是 。 4、在与回归系数有关的假设检验中,全模型与约简模型的残差平方和和的大小关系为 。 5、对于线性回归模型,检验和的交叉乘积项对的综合影响是否显著,建立的全模型是 。 6、以修正的复相关系数 作为回归方程的评选准则,称为修正的复相关系数准则。 7、在单因素方差分析中,利用误差平方和得到的误差方差的无偏估计是 . 8、设随机向量的协差矩阵的特征值 的第一主成分提取的总信息的份额为 。 9、设是来自协差阵为的总体的两个样品,则之间的马氏平方距离为 。 10、在两个总体的贝叶斯判别中,当训练样本是在自然状态下观察得到时,若总体的训练样本的容量分别为20和30,则采用“按比例分配”原则确定的先验概率为 , 。 二、单项选择题(每题2分,共10分) 1、在以下表示数据位置的数字特征中,既能充分利用样本信息又具有较强稳健性的是 。 均值 中位数 分位数 三均值 2、若总体的偏度,峰度,则总体分布 。 向左侧更为扩展且细尾 向右侧更为扩展且细尾 向左侧更为扩展且粗尾 向右侧更为扩展且粗尾 3、两因素等重复试验下的方差分析,误差方差的无偏估计为 。 因素的均方 误差均方 交互效应的均方 因素的均方 4、在采用距离进行快速聚类时,最终聚点 . 是每一类的中位向量且有较强的稳健性 是每一类的中位向量且不具有抗扰性 是每一类的均值向量且有较强的稳健性 是每一类的均值向量且不具有抗扰性 5、下图(1)(2)分别是以因变量和自变量的观测值为横坐标的残差图,由残差图分析知 。 误差的等方差性假定不合理 回归函数可能是非线性的,需要引进二次项或交叉乘积项 拟合值线性趋势未完全消除,可能遗漏与有线性关系的自变量 回归方程中应引进的二次项,即回归函数关于非线性。 三、分析计算题(每题10分,共20分) 1、对于回归模型,假定误差项独立同分布于,写出检验假设的约简模型、检验统计量及其零分布。 2、设有两个二维正态总体,为待判样品,若,,均值向量为,(1)试判断来自哪一个总体? 四、应用题(每题15分,共30分) 1、从1975年1月到1976年12月,对纽约证券所的三种化工股票和两种石油股票的周反弹率进行连续100周的观测(其中周反弹率=本周五收盘价-上周五收盘价),求得其样本相关系数矩阵为 利用SAS Proc princomp过程,求得其特征值和正交单位化特征向量为 计算这两个主成分的方差贡献率,前两个主成分的累计方差贡献率以及用这两个主成分代替原来五个变量的信息损失。 对这两个主成分的意义作一个合理的解释。 2、为比较同类型的三种不同食谱的营养效果,将19只幼鼠随机分为三组,每组分别为9只、5只和7只,各采用这三种食谱喂养,假定其他条件均保持相同,12周后侧得其体重增加值如下表: 食谱 体重增加量 甲 164 190 203 205 206 214 228 257 244 乙 185 197 201 231 212 丙 287 212 215 220 248 265 281 设体重增加数据服从方差分析模型,SAS过程为:

文档评论(0)

sa1fs5g1xc1I + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档