数字化 常用名词.pdf

  1. 1、本文档共14页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

数字化常用名词--第1页

1、绝对数和相对数

绝对数:是反应客观现象总体在一定时间、一定地点下的总规模、总水平的综合性指标,也

是数据分析中常用的指标。比如年GDP,总人口等等。

相对数:是指两个有联系的指标计算而得出的数值,它是反应客观现象之间的数量联系紧密

程度的综合指标。相对数一般以倍数、百分数等表示。相对数的计算公式:

相对数=比较值(比数)/基础值(基数)

2、百分比和百分点

百分比:是相对数中的一种,它表示一个数是另一个数的百分之几,也称为百分率或百分数。

百分比的分母是100,也就是用1%作为度量单位,因此便于比较。

百分点:是指不同时期以百分数的形式表示的相对指标的变动幅度,1%等于1个百分点。

3、频数和频率

频数:一个数据在整体中出现的次数。

频率:某一事件发生的次数与总的事件数之比。频率通常用比例或百分数表示。

4、比例与比率

数字化常用名词--第1页

数字化常用名词--第2页

比例:是指在总体中各数据占总体的比重,通常反映总体的构成和比例,即部分与整体之间

的关系。

比率:是样本(或总体)中各不同类别数据之间的比值,由于比率不是部分与整体之间的对比

关系,因而比值可能大于1。

5、倍数和番数

倍数:用一个数据除以另一个数据获得,倍数一般用来表示上升、增长幅度,一般不表示减

少幅度。

番数:指原来数量的2的n次方。

6、同比和环比

同比:指的是与历史同时期的数据相比较而获得的比值,反应事物发展的相对性。

环比:指与上一个统计时期的值进行对比获得的值,主要反映事物的逐期发展的情况。

7、变量

变量来源于数学,是计算机语言中能储存计算结果或能表示值抽象概念。变量可以通过变量

名访问。

8、连续变量

数字化常用名词--第2页

数字化常用名词--第3页

在统计学中,变量按变量值是否连续可分为连续变量与离散变量两种。在一定区间内可以任

意取值的变量叫连续变量,其数值是连续不断的,相邻两个数值可作无限分割,即可取无限

个数值。如:年龄、体重等变量。

9、离散变量

离散变量的各变量值之间都是以整数断开的,如人数、工厂数、机器台数等,都只能按整数

计算。离散变量的数值只能用计数的方法取得。

10、定性变量

又名分类变量:观测的个体只能归属于几种互不相容类别中的一种时,一般是用非数字来表

达其类别,这样的观测数据称为定性变量。可以理解成可以分类别的变量,如学历、性别、

婚否等。

11、均值

即平均值,平均数是表示一组数据集中趋势的量数,是指在一组数据中所有数据之和再除以

这组数据的个数。

12、中位数

对于有限的数集,可以通过把所有观察值高低排序后找出正中间的一个作为中位数。如果观

察值有偶数个,通常取最中间的两个数值的平均数作为中位数。

数字化常用名词--第3页

数字化常用名词--第4页

13、缺失值

它指的是现有数据集中某个或某些属性的值是不完全的。

14、异常值

指一组测定值中与平均值的偏差超过两倍标准差的测定值,与平均值的偏差超过三倍标准差

的测定值,称为高度异常的异常值。

15、方差

是衡量随机变量或一组数据时离散程度的度量。概率论中方差用来度量随机变量和其数学期

望(即均值)之间的偏离程度。统计中的方差(样本方差)是每个样本值与全体样本值的平

均数之差的平方值的平均数。在许多实际问题中,研究方差即偏离程度有着重要意义。方差

是衡量源数据和期望值相差的度量值。

16、标准差

又常称均方差,是离均差平方的算术平均数的平方

文档评论(0)

159****8730 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档