- 1、本文档共86页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据描述方法
课本:统计学 ─从数据到结论 吴喜之编著 中国统计出版社 参考书目: Business Statistics: A Decision-making Approach (D. F. Groebner P. W. Shannon) 《商务与经济统计精要》(原书第2版)戴维R·安德森等著,机械工业出版社,2005。 《统计分析与SPSS的应用》,薛薇编著,中国人民大学出版社,2001。 《多元统计分析》何晓群编著,中国人民大学出版社,2004。 课程大纲1 统计学基本概念、数据收集和数据描述2 线性回归分析和广义线性模型SPSS上机3 聚类分析 + SPSS上机4 判别分析 + SPSS上机5 主成份+ 因子分析、6 对应分析+SPSS上机 统计学的定义 统计学(statistics)是“收集、分析、展示和解释数据的科学” 什么地方统计用得上呢? 任何领域. 运用统计的领域包括(1) 精算 农业 动物学 人类学 考古学 审计学 晶体学 人口统计学 牙医学 生态学 经济计量学 教育学 选举预测和策划 工程 流行病学 统计可应用于各个不同学科,在有些学科已经有其特有的方法和特点;如生物统计(biostatistics), 计量经济学(econometrics)以及目前很热门的生物信息(bioinformation)和数据挖掘(Data Mining)的方法主体都是统计。 以归纳为主要思维方式的统计不是以演绎为主的数学 如何用一部分数据较好地代表所有数据与抽样有关的概念:总体、样本、个体和样本量普查和抽样框参数和统计量 此例中,单个山东和广东人或个人的身高数据称为个体(individual) 而称所有所有山东和广东人或他们的身高数据为总体(population),总体是包含所有要研究的个体的集合。 抽样抽到的人或身高数据称为该总体的样本(sample),样本是总体的一部分。样本中个体的个数--样本量(sample size) 当然,也有可能试图调查所有的人(比如人口普查), 叫做普查(census). 抽样框(Frame)–所关心的所有对象或个- 是总体的一部分 一些常用的抽样方法 1 简单随机样本 如果总体中的每一个体都有同等机会被选到样本中,这种抽样称为简单随机抽样(simple random sampling),而这样得到的样本则称为简单随机样本(random sample) . 如:通常的抽奖、抓阄 问卷调查中,没有随机找人回答问卷而是找一些你认识的人填写问卷- 这种样本也不是随机样本,而是方便样本(convenience sample)。 2.系统抽样(systematic sampling): 先把总体中的单元编号,然后随机选取其中之一作为抽样的开始点, 然后从开始点按照编号进行等距抽样 例:从60人的一班人中,随机抽出5人,如开始点为10号, “距离”为12,则调查对象为: 10号、22号、34号、46号、58号 - 如果原始名单号是随机的,得到的抽样对象是随机的。 3. 整群抽样(cluster sampling): 先把总体划分成若干群(cluster),再(通常是随机地)从这些群中抽取几群;然后再在这些群中随机地抽取个体。 例:在某县进行调查,首先在所有村中选取若干村子,然后只对这些村子的人进行调查。显然,如果各村情况差异不大,这种抽样还是方便的。 4.分层抽样(stratified sampling)。这是先把要研究的总体按照某些性质分类(stratum),再在各类中分别随机抽取样本。 例1:经理意见调查- 目标是从大、小企业得到各200有效问卷 例2:按照教育程度把要访问的人群分成几类;每一类中调查和该类成比例数目的人。以确保每一类都有按比例的代表。 5. 多级抽样(multistage sampling)。在群体很大时,往往在抽取若干群之后,再在其中抽取若干子群,甚至再在子群中抽取子群,等等。最后只对最后选定的最下面一级进行调查。 例:在全国调查时,先抽取省,再抽取市地,再抽取县区,再抽取乡、村直到户。 抽样方法的选择不能一概而论 实际上每个抽样通常都可能是各种抽样方法的组合。如: 在多级抽样中的每一级也可采取各种抽样方法。此时,整个抽样计划可能比较复杂,也称为多级混和型抽样 制定抽样方案时既要考虑精确度,还要根据客观情况考虑方便性、可行性和经济性。不能一概而论。 定量和定性变量 当变量所取的值是数量时称为定量变量(quantitative variable) 如: 收入(元)、重量(kg)、身高(cm)、某企业广告投入(元)、某企业销售额(元) 取非数量值的变量就称为定性变量
文档评论(0)