- 1、本文档共52页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第11讲(第14章) 数据分析;数据整理的程序一般如下:
1. 对原始资料进行审核、订正
2. 编码
3. 数据的录入
4. 数据的清洁
5. 进行统计预处理
6. 制订数据分析的初步方案
7. 数学处理;在大量的调查工作结束后,就要对这些资料进行统计归类、整理分析,即统计分析
对调查资料进行整理统计
运用统计图进行描述性分析
进行分布分析和相对分析
集中量数分析与离中量数分析;Contents;第一节 数据分析的作用与要求;数据分析在数据收集之后进行,但应根据整个项目的目的、特点预先设计好数据分析技术,制订数据分析计划。
数据分析计划:
确定所需变量
测量这些变量所用的方法
数据分析过程及所用的技术;Contents;统计描述;频数直方图;交叉列表分析;性别和互联网使用频率;某保险公司对影响保户开车事故率的因素进行调研,并对各种因素进行了交叉表分析。
交叉表法的起点是单变量数据,然后依研究目的将这些数据分成两个或多个细目。
表1 驾驶员的事故率;然后,在性别基础上分解这个信息,判断是否在男女驾车者之间有差别。这样就出现了二维交叉表2。
表2 男女驾驶员的事故率
;这个表的结果令男士懊恼,因为他们的事故率较女士驾车时涉及的事故率要高。但人们会提出这样的疑问而否定上述判断的正确性,即男士的事故多,是因为他们驾驶的路程较长。这样就引出第三个因素驾驶距离,于是出现了三维交叉表3。
表3 不同驾驶距离下的事故率
;结果表明:男士驾驶者的高事故率是由于他们的驾驶距离较女士长,但并没有证明男士和女士哪个驾驶得更好或更谨慎,仅证明了驾车事故率只与驾驶距离成正比,而与驾驶者的性别无关。;二、交叉列表分析中变量的选择和确定;三、双变量交叉列表分析法;例;例;例;例;四、三变量交叉列表分析法;;提炼原来的关系;Purchase of Fashion Clothing by Marital Status;原来的关系是虚假的;Ownership of Expensive Automobiles by Education Level and Income Levels;揭示隐藏的联系;Desire to Travel Abroad by Age and Gender;原来的关系没有变化;交叉列联表分析的优缺点;;Contents;数据资料的概括技术; 1. 钟形分布; 2. J形分布; 3. U形分布; 4. 多峰分布;统计量;集中趋势指标 (Measures of Location);差异性指标 (Measures of Variability );方差 variance
标准差 standard deviation
变异系数 coefficient of variation
;形状指标 (Measures of Shape);Skewness of a Distribution;Contents;1. 总量指标和相对指标
总量指标是反映社会经济现象总体规模或水平的指标,又称为绝对数。
相对指标是两个有联系的总量指标对比计算的比率,又称为相对数。; 根据相比较的总量指标之间的关系不同,相对指标可以划分为若干种类型:
(1)结构相对指标:
(2)比例相对指标:;(3)强度相对指标:
(4)比较相对指标:
(5)动态相对指标:;2. 描述总量指标和相对指标的一些常用术语
(1)静态比较与动态比较
(2)基期与报告期
报告期又称为计算期,即被研究的时期。
作为比较基础的时期称为“基期”。
(3)时期和时点;发展水平
发展水平就是动态数列中的每一项具体指标数值。其数值可以表现为绝对数、相对数或平均数。
增长量 = 报告期水平 -基期水平
发展速度
3. 增长速度;利用excel进行数据分析;【思考题】
1.调查资料的处理包括哪些步骤?
2.调查资料的审核包括哪些内容?
3.如何对问卷中封闭式问题进行编码?
4.如何对问卷中开放式问题进行编码?
5.数据自动清理包括哪些内容?
6.对于缺失数据处理的方法有哪些?
7.数据集中趋势的指标有哪些?各有何其特色?
8. 数据离散趋势的指标有哪些?各有何其特色?
9.什么是交叉列表?如何正确的选择和确定交叉列表中的变量?
10.什么是两变量交叉列表?
11.什么是三变量交叉列表?
12.怎样对两变量交叉列表中的两变量相关关系进行判断?
您可能关注的文档
- 传热学青岛科技大学第五章.ppt
- 传统品牌发展之路.ppt
- 传统游戏汇总.ppt
- 传统文化与音乐.ppt
- 11.何琴广西浦北外国语学校平行四边形课件.ppt
- 住院病人的营养评价.ppt
- 余弦函数单调性.ppt
- 作一条线段等于已知线段.ppt
- 11.敬畏自然课件.ppt
- 作为一名英语教师的思考.ppt
- 2025-2030年中国采暖散热器行业十三五规划及发展前景分析报告.docx
- 2025-2030年中国软体移动沼气项目可行性研究报告.docx
- 2025-2030年中国辐照加速器行业运行态势与发展策略分析报告.docx
- 2025-2030年中国金属轧机用轧辊行业市场竞争策略及发展趋势分析报告.docx
- 2025-2030年中国钐钴磁性材料产业运营状况及发展趋势分析报告.docx
- 2025-2030年中国钢材轧延行业运营态势与发展风险分析报告.docx
- 2025-2030年中国硫酸钡行业发展现状及前景趋势分析报告.docx
- 2025-2030年中国碳化纤维行业发展现状规划分析报告.docx
- 2025-2030年中国碱性锌锰电池市场十三五规划及投资战略研究报告.docx
- 国家开放大学2185电子商务法律与法规2014年01月期末笔试真题及答案.pdf
文档评论(0)