- 1、本文档共14页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第一章
统计:收集、处理、分析、解释数据并从数据中得出结论的科学。
数据1. 分类数据 对事物进行分类的结果数据,表现为类别,用文字来表述. 例如,人口按性别分为男、女两类
2. 顺序数据 对事物类别顺序的测度,数据表现为类别,用文字来表述 例如,产品分为一等品、二等品、三等品、次品等
3. 数值型数据 对事物的精确测度,结果表现为具体的数值.例如:身高为175cm ,168cm,183cm
总体– 所研究的全部元素的集合,其中的每一个元素称
为个体– 分为有限总体和无限总体.有限总体的范围能够明确确定,且元素的数目是有限的.无限总体所包括的元素是无限的,不可数的
样本– 从总体中抽取的一部分元素的集合– 构成样本的元素数目称为样本容量
参数:描述总体特征。有总体均值(?)、标准差(σ)总体比例(π)统计量:描述样本特征。样本标准差(s),样本比例(p)
变量:说明现象某种特征,分类,顺序,数值型:离散型,连续型。经验,理论变量
描述统计研究的是数据收集,处理,汇总,图表描述,概括与分析等统计方法。推断统计是研究如何利用样本数据进行推断总体特征
第二章
间接数据(查询的)与直接数据:调查(通常是对社会现象而言的)普查信息全面完整。再一个是实验。
概率抽样:也称随机抽样。按一定的概率以随机原则抽取样本,抽取样本时使每个单位都有一定的机会被抽中– 每个单位被抽中的概率是已知的,或是可以计算出来的– 当用样本对总体目标量进行估计时,要考虑到每个样本单位被抽中的概率
简单随机抽样:从总体N个单位中随机地抽取n个单位作为样本,每个单位入抽样本的概率是相等的
分层抽样:
优点:保证样本的结构与总体的结构比较相近将抽样单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本,从而提高估计的精度– 组织实施调查方便– 既可以对总体参数进行估计,也可以对各层
的目标量进行估计
整群抽样: 将总体中若干个单位合并为组(群),抽样时直接抽取群,然后对中选群中的所有单位全部实施调查
优点: 抽样时只需群的抽样框,可简化工作量– 调查的地点相对集中,节省调查费用,方便调查的实施– 缺点是统计的精度较差
系统抽样: 将总体中的所有单位(抽样单位)按一定顺序排列,在规定的范围内随机地抽取一个单位作为初始单位,然后按事先规定好的
规则确定其它样本单位– 先从数字1到k之间随机抽取一个数字r作为
初始单位,以后依次取r+k,r+2k…等单位
操作简便,可提高估计的精度
多阶段抽样: 先抽取群,但并不是调查群内的所有单位,而是再进行一步抽样,从选中的群中抽取出若干个单位进行调查– 群是初级抽样单位,第二阶段抽取的是最终抽样单位。将该方法推广,使抽样的段数增多,就称为多阶段抽样
非概率抽样:方便抽样(自行确定入抽样本单位),判断抽样(根据经验判断),自愿样本(被调查者自愿参加),滚雪球抽样(对稀少群体的调查),配额抽样(先将体中的所有单位按一定的标志(变量)分为若干类,然后在每个类中采用方便抽样或判断抽样的方式选取样本单位)。
概率抽样与非概率抽样的比较
1. 概率抽样
– 依据随机原则抽选样本– 样本统计量的理论分布存在– 可根据调查的结果推断总体
2. 非概率抽样
– 不是依据随机原则抽选样本– 样本统计量的分布是不确定的 无法使用样本的结果推断总体
数据收集的方法:自填式,面访式,电话式
数据误差:抽样误差(样本量的大小),非抽样误差。误差的控制
统计数据的质量要求
1. 精度:最低的抽样误差或随机误差2. 准确性:最小的非抽样误差或偏差3. 关联性:满足用户决策、管理和研究的需要4. 及时性:在最短的时间里取得并公布数据5. 一致性:保持时间序列的可比性
6. 最低成本:以最经济的方式取得数据
第三章
数据审核(完整性和准确性)数据筛选(符合特定条件)数据排序(那一定顺序)数据透视(按需要汇总)
频数(frequency) :落在各类别中的数据个数比例(proportion) :某一类别数据占全部数据的比值百分比(percentage) :将对比的基数作为100而计算的比值比率(ratio) :不同类别数值的比值
条形图:用宽度相同的条形的高度或长短来表示
各类别数据的图形。有单式条形图、复式条形图等形式主要用于反映分类数据的频数分布,绘制时,条形图可以横置或纵置,纵置时也称为柱形图。
帕累托图:按类别数据出现的频数多少排序后绘制的条形图
饼图:也称圆形图,是用圆形及圆内扇形的角度来表示数值大小的图形2. 主要用于表示总体或样本中各组成部分所占的比例,对于研究结构性问题十分有用
组距分组:将变量值的一个区间作为一组2. 适合于连续变量3. 适合于变量值较多的情况4. 需要遵循“不重不漏”的原则5. 可采用等距分组,也可采用不等距分组
您可能关注的文档
- 体系文件制作规范.doc
- 体育社会学-第15章-社会体育的社会学分析.doc
- 国际金融试题A(last-year).doc
- 北京林业大学东升教学实习苗圃总体规划设计.doc
- 北京人民法院心理测试真题.doc
- 国际贸易理论试题及答案.doc
- 天津狗不理快餐连锁公司经营战略.doc
- 北京市空气质量评价与预测.doc
- 国际贸易试卷及答案5套.doc
- 国际企业管理论文完整.doc
- 2024年江西省寻乌县九上数学开学复习检测模拟试题【含答案】.doc
- 2024年江西省省宜春市袁州区数学九上开学学业水平测试模拟试题【含答案】.doc
- 《GB/T 44275.2-2024工业自动化系统与集成 开放技术字典及其在主数据中的应用 第2部分:术语》.pdf
- 中国国家标准 GB/T 44275.2-2024工业自动化系统与集成 开放技术字典及其在主数据中的应用 第2部分:术语.pdf
- GB/T 44285.1-2024卡及身份识别安全设备 通过移动设备进行身份管理的构件 第1部分:移动电子身份系统的通用系统架构.pdf
- 《GB/T 44285.1-2024卡及身份识别安全设备 通过移动设备进行身份管理的构件 第1部分:移动电子身份系统的通用系统架构》.pdf
- 中国国家标准 GB/T 44285.1-2024卡及身份识别安全设备 通过移动设备进行身份管理的构件 第1部分:移动电子身份系统的通用系统架构.pdf
- GB/T 44275.11-2024工业自动化系统与集成 开放技术字典及其在主数据中的应用 第11部分:术语制定指南.pdf
- 中国国家标准 GB/T 44275.11-2024工业自动化系统与集成 开放技术字典及其在主数据中的应用 第11部分:术语制定指南.pdf
- 《GB/T 44275.11-2024工业自动化系统与集成 开放技术字典及其在主数据中的应用 第11部分:术语制定指南》.pdf
文档评论(0)