- 1、本文档共11页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
2025年统计学期末考试题库:数据分析计算与数据清洗试题
考试时间:______分钟总分:______分姓名:______
一、单项选择题(每题2分,共20分)
1.在统计学中,用来描述总体中各单位的数量标志值在总体各单位之间的分布特征和差异程度的指标是:
A.平均数
B.中位数
C.众数
D.标准差
2.以下哪项不是描述数据的集中趋势的指标:
A.平均数
B.中位数
C.众数
D.离散系数
3.以下哪项不是描述数据的离散程度的指标:
A.平均数
B.离散系数
C.极差
D.标准差
4.在数据清洗过程中,以下哪项操作不是数据清洗的常见步骤:
A.检查缺失值
B.检查异常值
C.数据类型转换
D.数据标准化
5.以下哪项不是数据清洗的常见目的:
A.提高数据质量
B.减少数据冗余
C.提高数据可用性
D.增加数据多样性
6.以下哪项不是数据清洗中常用的缺失值处理方法:
A.删除含有缺失值的记录
B.使用均值填充
C.使用中位数填充
D.使用众数填充
7.在数据清洗过程中,以下哪项不是异常值处理的方法:
A.删除异常值
B.平滑异常值
C.赋予异常值特殊值
D.使用均值替换
8.以下哪项不是数据清洗中常用的数据类型转换方法:
A.字符串转整数
B.日期格式转换
C.数值格式转换
D.文本处理
9.在数据清洗过程中,以下哪项不是数据标准化方法:
A.标准化
B.归一化
C.极值归一化
D.对数变换
10.以下哪项不是数据清洗中常用的数据预处理方法:
A.数据清洗
B.数据集成
C.数据转换
D.数据规约
二、多项选择题(每题3分,共30分)
1.以下哪些是描述数据集中趋势的指标:
A.平均数
B.中位数
C.众数
D.离散系数
2.以下哪些是描述数据离散程度的指标:
A.极差
B.标准差
C.离散系数
D.方差
3.以下哪些是数据清洗的常见步骤:
A.检查缺失值
B.检查异常值
C.数据类型转换
D.数据标准化
4.以下哪些是数据清洗的常见目的:
A.提高数据质量
B.减少数据冗余
C.提高数据可用性
D.增加数据多样性
5.以下哪些是数据清洗中常用的缺失值处理方法:
A.删除含有缺失值的记录
B.使用均值填充
C.使用中位数填充
D.使用众数填充
6.以下哪些是数据清洗中常用的异常值处理方法:
A.删除异常值
B.平滑异常值
C.赋予异常值特殊值
D.使用均值替换
7.以下哪些是数据清洗中常用的数据类型转换方法:
A.字符串转整数
B.日期格式转换
C.数值格式转换
D.文本处理
8.以下哪些是数据清洗中常用的数据标准化方法:
A.标准化
B.归一化
C.极值归一化
D.对数变换
9.以下哪些是数据清洗中常用的数据预处理方法:
A.数据清洗
B.数据集成
C.数据转换
D.数据规约
10.以下哪些是数据清洗中常用的数据清洗工具:
A.Excel
B.Python
C.R
D.MySQL
四、简答题(每题10分,共30分)
1.简述数据清洗的步骤及其重要性。
2.解释什么是数据标准化,并列举三种常用的数据标准化方法。
3.说明什么是异常值,以及如何处理异常值。
五、计算题(每题20分,共60分)
1.已知某班级学生身高数据如下(单位:cm):160,165,170,175,180,185,190,195,200。请计算该班级学生身高的平均数、中位数、众数、标准差。
2.某城市居民月收入数据如下(单位:元):5000,5200,5300,5400,5500,5600,5700,5800,5900,6000。请计算该城市居民月收入的平均数、中位数、众数、标准差。
3.某公司员工年龄数据如下(单位:岁):25,28,30,32,35,37,40,42,45,50。请计算该公司员工年龄的平均数、中位数、众数、标准差。
六、应用题(每题20分,共40分)
1.某公司销售部门在一个月内收集了以下销售数据(单位:万元):10,12,15,18,20,25,30,35,40,45。请使用箱线图展示该销售数据的分布情况,并分析是否存在异常值。
2.某地区居民消费水平数据如下(单位:元):2000,2500,3000,3500,4000,4500,5000,5500,6000,6500。请使用直方图展示该消费水平的分布情况,并分析数据是否呈现正态分布。
本次试卷答案如下:
一、单项选择题
1.D.标准差
解析:标准差是描述数据离
文档评论(0)