- 1、本文档共15页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
第2章数据类型和数据收集课程类别:专业必修课授课对象:经管类本科生12.3抽样技术-概率抽样
为什么“大数据”也会跑偏?《文学摘要》在1936年之前连续五届准确地预测了美国总统大选.1936年,以电话簿上的地址和汽车车主的登记资料地址发放1000万份问卷,回收237万份.调查结果:认为兰登获胜.结局:罗斯福以62%对38%的巨大优势获胜,连任总统.富兰克林·罗斯福艾尔弗·兰登《文学摘要》1936年的美国大选预测2
概率抽样(probabilitysampling)特点:按一定的概率以随机原则抽取样本.每个单位被抽中的概率是已知的,或是可以计算的.作用:可以计算估计量误差,能够用于对总体参数进行估计.概率抽样也称随机抽样样本总体推断概率抽样抽样框:企业名录、学生名单等?3
简单随机抽样(simplerandomsampling)局限性抽出单位分散,实施调查困难.?123465789367总体样本优点(1)简单、直观.(2)抽取概率相等,估计方便.4
问题1某高校有在校生25000人,其中女生23000人,男生2000人.某机构为了解该校学生的网购消费水平和消费偏好,要从该校学生中抽取1%的学生进行调查.你认为应当怎样抽取样本?(1)不同性别的网购消费水平和偏好可能存在明显差异.(2)两个类别的人数相差较大,需要考虑各自的情况.样本量样本中的男生2500可以用简单随机抽样?5
问题1某高校有在校生25000人,其中女生23000人,男生2000人,抽取1%样本.男生2000人女生23000人总体男生20人女生230人样本男女生各抽取1%6
分层抽样(stratifiedsampling)将抽样单位划分为不同的层.从不同的层中独立、随机地抽取样本.567911108121059总体样点保证样本的结构与总体的结构比较相近,提高估计精度.可对总体参数进行估计,也可对各层的目标量进行估计.局限性抽出单位分散,调查困难.适用情形:总体在“层”间差异较大,“层”内差异较小.7
问题2问题分析:(1)班级之间差异较小,专业背景相似.(2)班级内部差异较大,男女生消费水平和消费偏好可能存在较大差异.某高校商学院有在校生5000人,共50个班级,每个班男女生共100人.某机构为了解该学院学生的网购消费水平和消费偏好,要从该学院学生中抽取10%的学生进行调查.你认为应当怎样抽取样本?8
问题2班级1总体班级2班级3······班级49班级50班级40班级13班级18班级46班级6样本某高校商学院有在校生5000人,共50个班级,每个班男女生共100人.某机构为了解该学院学生的网购消费水平和消费偏好,要从该学院学生中抽取10%的学生进行调查.你认为应当怎样抽取样本?9
整群抽样(clustersampling)将总体中若干个单位合并为群,直接抽取群.对群中的所有单位全部实施调查.5679111081211910总体样点只要群的抽样框,简化工作量.调查的地点相对集中.局限性抽样误差较大适用情形:总体在“群”间差异较小,“群”内差异较大10
系统抽样(systematicsampling)?567911108126总体样本2134210??11
系统抽样的理解????????123456789101112理解1:将总体均分为若干个层,每个层中随机抽取1个单位(分层抽样)群1群2群3群4123456789101112理解2:抽样框转换为二维表,随机抽取1列(整群抽样)12
系统抽样的理解优点(1)简便.(2)一般情况下在总体中分布均匀,抽样误差小于简单随机抽样.局限性(1)总体中观察单位按顺序有周期趋势时,可能产生明显的系统误差.(2)抽出单位分散,实施调查困难.学号成绩k2k3k4kr13
总结简单随机抽样分层抽样系统抽样整群抽样各层中简单随机抽样简单随机抽样群特例等分后简单随机抽样特例适用情形互补14
思考与练习思考:为什么2016年美国大选的该民调结果与实际结果相反?可能的原因有哪些?练习:见课程的网络平台.15
您可能关注的文档
- 百年学典·同步导学与优化训练·地理·七年级下册 第7章 认识中国的区域 第二节 四川省.pptx
- 百年学典·同步导学与优化训练·地理·七年级下册 第7章 认识中国的区域 第六节 台湾省.pptx
- 百年学典·同步导学与优化训练·地理·七年级下册 第7章 认识中国的区域 第七节 认识家乡——以福建省泰宁县为例.pptx
- 百年学典·同步导学与优化训练·地理·七年级下册 第7章 认识中国的区域 第三节 黄土高原.pptx
- 百年学典·同步导学与优化训练·地理·七年级下册 第7章 认识中国的区域 第四节 长江中下游平原.pptx
- 百年学典·同步导学与优化训练·地理·七年级下册 第7章 认识中国的区域 第五节 珠江三角洲地区.pptx
- 百年学典·同步导学与优化训练·地理·七年级下册 第7章 认识中国的区域 第一节 首都北京.pptx
- 《统计学》教学大纲.docx
- 教学设计样例 一个总体比例的假设检验 .pdf
- 统计学中的似是而非(课前读物).pdf
最近下载
- Unit 7 Being a Smart Shopper 第4课时 Theme Reading课件-七年级英语下册(仁爱科普版2024).pptx VIP
- 扬尘污染防治培训课件总结.pptx VIP
- 含课件2024国家安全教育国土安全(1).pdf VIP
- 超市食品部门从业人员食品安全知识培训.pptx VIP
- 信息技术基础模块(WPS版)中职全套完整教学课件.pptx
- 化验员上岗安全培训试题及答案.doc
- 综采知识培训课件.pptx
- 河南省执法证考试题库——2024年整理.pdf
- 统编版道德与法治八年级下册知识点梳理.pdf VIP
- 人教精通版英语六年级下册 Unit5 Task7-Task8 练习卷.doc VIP
文档评论(0)