- 1、本文档共15页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据分析方法与技术作业及答案课件
一、填写题(抄题,写答案)数据分析“六步曲”按顺序依次是:明确分析目的和内容、数据收集、数据处理、数据分析、数据展现、报告撰写。定量数据一般可分为计量的、计数的、二种类型。定性数据一般可分为有序的、名义的、二种类型。数据收集方法总的可分为一手数据、二手数据、两大类。前一类方法常用的具体方法有调查法、观察法、实验法;后一类方法常用的具体方法有机构查询、书刊查询、网络查询。SPSS中有三种主要的工作窗口,它们是:数据编辑窗口、结果浏览窗口、程序编辑窗口;在进行数据表编辑时,有二种主要视图,它们是:数据视图、变量视图。SPSS中对变量属性进行定义时,对变量的命名在Name栏中设置,定义变量值标签在 Values栏中设置。根据数据的计量性质,可以将数据分为定量的数据和定性的数据;根据数据获得的直接性,可以将数据分为一手数据和二手数据。统计检验的一种思路是:设定原假设H0,构造相应的统计判断量,当根据实验数据或样本数据计算出的统计判断量落在拒绝区域,则拒绝原假设;反之,则落在接受区域,接受原假设。在SPSS软件的统计操作中,通过计算样本数据的实际显著性概率Sig.,并将其与给定的显著性概率水平比较,当 Sig.时(填“” 或“” ),则拒绝原假设。方差分析主要用来判断样本数据之间的差异是由不可控的随机因素造成的还是由研究中施加的对结果形成影响的可控因素造成的。因子分析法是多元统计分析中处理降维的一种,其最主要的工作是降维,即将具有错综复杂关系的变量或者样品综合为数量较少的几个因子,以再现原始变量与因子之间的相互关系。下图所示因子分析结果中,数值6.845的含义是第一主成分特征根,数值84.421的含义是前三个主成分的累计贡献率;在Extraction Sums块中,有三行数据,其含义是根据提取因子条件----特征值大于1,共选出了三个公共因子。下图所示椭圆圈中信息的含义 11变量,200样例。强规则是指:同时满足最小支持度阈值和最小置信度阈值的规则。Statistica中实现聚类分析的过程是:[Statistics]/[ Multivariate Exploratory Techniques]/[Cluster Analysis]。在对二值变量定类数据的距离进行计算时,若认为所取两个值的地位不对等,则可以用雅克比匹配系数对距离进行度量。熵可以作为训练集的不纯度度量,熵越大,不纯度就越高(高或低)。决策树的分枝原则就是使划分后的样本的子集越纯越好,即它们的熵越小越好。CRT算法的全称是Classification and Regression Trees,它所构成的决策树是二叉树,该算法用gini指标指标作为选择分枝方案的依据,在选择分枝方案时,需经两步完成,第一步,在每个节点处评估所有属性的每个标准问题的 gini 指标,第二步,选择gini 指标最大的标准问题作为分枝方案。已知某数据集中某属性的不同取值为,{2.6,1, 2.9, 2,5,4.2,2.3,3 },则该属性的标准问题集为{Is A≤1.5,Is A≤2.15,Is A≤2.45,Is A≤2.75,Is A≤2.95,Is A≤3.6,Is A≤4.6}。已知某数据集中某属性的不同取值为,{优,良,中,差},则该属性的标准问题集为 {Is A∈{优},Is A∈{良},Is A∈{中},Is A∈{优,良},Is A∈{良,中},Is A∈{优,中},Is A∈{优,良,中}。二、单项选择题(抄题干及你认为正确的选项,图可以不画)Excel中,当把F7单元格复制到G8单元格时出现了如下信息提示,关于这一现象,以下描述正确的是( C )。(A) G8单元格的数据应该是17,可能格式设置为小数点后5位,超过了单元格显示区域,出现此提示(B) C8或D8单元格的数据有问题 (C) D8和E8不能相加(D) F8为空值,无法加总得到结果在Excel中,要实现如下图所示的汇率换算,可以在D5单元格中输入(B),之后将它复制到下面的单元格,就可以实现不同币值的换算。(A) $C$2*C5 (B) =C$2*C5 (C) =6.912*786 (D) =C2*C5以下关于SPSS中定义变量值标签的描述中,错误的是(C)(A) 定义值标签可简化数据录入(B) 在显示数据表时,通过点击工具栏中的Value Labels按钮,可以在标签和值之间切换显示(C) 通过定义值标签可以为不同范围的数据定义不同的标签显示(D) 值标签的定义可以实现只输入标签就可以输入实际的数据SPSS19版本中数据文件的扩展名是(A)(A) .sav (B) .sps (C) .dat (D) .xls如果将数据分析方法论比喻成服装
您可能关注的文档
- 数学建模-物理模型.ppt
- 数学建模论文排版..ppt
- 数学建模非线性规划.ppt
- 数学建模课程及答案.doc
- 数学建模聚类分析.ppt
- 数学文化期末考试.doc
- 数学思想、活动经验、十大核心概念.ppt
- 数学教学结束设计.ppt
- 数学是研究数量关系和空间形式的科学.doc
- 数学建模综合评价与决策方法.ppt
- 重庆市北碚区西南大附中2023年九年级数学第一学期期末联考模拟试题含解析.doc
- 维修管铆工中级复习测试题.doc
- 如何做好创业初期的财务管理课件.ppt
- 苏州市工业2023年数学九上期末学业水平测试模拟试题含解析.doc
- 江苏省无锡市东湖塘中学2023年九年级数学第一学期期末检测试题含解析.doc
- 河南省沈丘县2023年数学九年级第一学期期末检测试题含解析.doc
- 特种作业(高压电工)练习测试题附答案.doc
- 内蒙古杭锦旗2023-2024学年物理九上期末达标检测模拟试题含解析.doc
- 如何做好创业初期营销管理课件.ppt
- 江苏省无锡市查桥中学2023-2024学年九年级数学第一学期期末联考模拟试题含解析.doc
文档评论(0)