- 1、本文档共6页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
修正调研数据 扩展使用限度
HYPERLINK /blog/2010/07/02/weight2/ \o 修正调研数据 扩展使用限度(下) 修正调研数据 扩展使用限度(下)
2010年07月02日 | HYPERLINK /blog/category/user_research/ 用户研究
如何加权——单变量比例加权
为了比较初级买家与高级买家之间对某一产品的体验差异,采用非等比随机抽样,事先增加了高级买家的抽中比例。 ?
当需要推及总体买家对这一产品的体验情况时,需要对数据进行加权,结果如下:
上表第d列 (S/P) 是用各级别买家在调研样本中占的比例除以其在总体中占的比例,其值越接近1,说明该级别买家在调研样本中的比重越合适;反之,其值越背离1,其在调研样本中的比重越不合适。
若恰巧各组的这一比值均接近1,可以近似等同总体分布,而不对调研样本进行加权。本例显然需要对调研样本进行加权。
首先要确定加权的起点在哪里?这里有三种选择:
1)以S/P的最小值(本例0.69)为起点,将其他组的S/P值都降低到这个水平,因此叫做Scale-down weighting(“水落石出”法)。其结果是将原调研样本缩小S/P最小值倍(本例0.69,原调研样本7200人,每组权重为0.69/d列相应值,加权后减至4968),放水过多,不合适
2)以S/P的最大值(如本例的8.33)为起点,将其他组的S/P值都提高到这个水平,这种策略叫做Scale-up weighting(“水高船涨”法)。其结果也就是将原来的调研样本放大S/P最大值倍(本例8.33倍,原调研样本7200人,每组权重为8.33/d列相应值,加权后会增至59976人),可见水分太大,不可取。
3)以S/P的加权平均值为起点,将大于1的S/P值调低至1而将小于1的S/P值调高至1,因此叫做Zero-sum weighting(“有增有减但总数不变”法)。加权后的样本数与原调研样本相同、还是7200(见表第f列)。可见这种方法相比之下最合理,学术界和调查业界通常都用它来加权。
?
??
比例加权需要注意的几个问题:
1)加权只能调整样本各组之间的相对比例、并不会产生任何新的信息。
2)一个重要细节是如果S/P值中有小于0.5(也即P/S值或权数大于2)的,则不能靠过分灌水来解决问题。这时的对策有三个:
? 增加那些采样不足的(under-sampled)组别的case数量(上策)
? 用S/P值最小值(Scale-down的策略)来加权(最保守、浪费资源、但不犯I类错误)
? 前两者的结合,即增加部分case数然后按新的最小S/P值来加权
3)如果那些采样不足的(under-sampled)组case数量太少(一般不能少于30),需要按2)同样的原则来处理。
对于2)和3)中提到的情况,另外一种变通的方法就是重新划分组,此法省时省力。
4)经过加权的样本,能够推算总体的常规统计量,但计算误差时则不能用加权样本直接计算。
5)为了便于解释,上述例子只涉及一个变量(买家级别)的加权。实际上,研究买家除了级别,注册时长、月成交量/额等也很重要。所以需要用多个变量同时加权 (weighted by several variables simultaneously)。
(本小节以上内容参考了香港城市大学祝建华博士的BLOG文章《 HYPERLINK /post.2695611.html 如何对样本进行加权?》 HYPERLINK /post.2695611.html /post.2695611.html,在此表示感谢,愿祝老师健康、笔耕不辍!)
?
总结一句话:在随机抽样的前提下,比例加权的本质就是将调研样本分布修正为等比随机抽样分布。
?
如何加权——单变量推及量加权
为什么用推及量加权:
1) 上小节提到的获取总体参数的变通方法:在总体中用简单随机抽样抽取一定数量的样本,能够获得一个较大的样本,用来推及总体依然带有少许误差。用加权处理的调研样本推及这个大样本群体的行为和态度更为恰当,有时候需要直观的知道这个大样本群体中每种划分的组内有多少人。
2)比例加权的运算方法有些麻烦;而推及量加权的运算方法简便。
?
推及量加权的依据:
1)加权的前提与比例加权相同:修正非等比随机抽样NPPS和等比随机抽样PPS
2)两种方法等价:
比例加权:Pn%/Sn%
推及量加权:Pn/Sn=(Pn%*P)/(Sn%*S)=(Pn%/Sn%)*P/S 由于每一组case相对于比例加权都扩大了P/S倍,即每一个样本都扩大了P/S倍。绝大部分研究结果都以比例呈现,而计算比例的时候,每一个样本扩大的P/S倍没有影响,因此推及量加权适用。
?
推及量加权需要注意的事项与比例加权相似,此不赘
您可能关注的文档
- 无比心水的桌面壁纸.ppt
- 1-1虚拟桌面无盘系统对比传统无盘.doc
- 必威体育精装版版高压节电器说明书071204.doc
- 关于九溪卫城马王庙.doc
- 脉搏到底和健康有着什么样的关系,脉搏有什么样的作用呢?_151.pdf
- 杨士群《最大的“书”》教学设计模板.doc
- 机械套筒连接在衬砌钢筋施工中的应用.doc
- 工程材料课件第03章 结晶相图.ppt
- 第八章 中生代地史.ppt
- pcb 专业术语 中英文对照四.doc
- [中央]2023年中国电子学会招聘应届生笔试历年参考题库附带答案详解.docx
- [吉安]2023年江西吉安市青原区总工会招聘协理员笔试历年参考题库附带答案详解.docx
- [中央]中华预防医学会科普信息部工作人员招聘笔试历年参考题库附带答案详解.docx
- [保定]河北保定市第二医院招聘工作人员49人笔试历年参考题库附带答案详解.docx
- [南通]江苏南通市崇川区人民法院招聘专职人民调解员10人笔试历年参考题库附带答案详解.docx
- [厦门]2023年福建厦门市机关事务管理局非在编工作人员招聘笔试历年参考题库附带答案详解.docx
- [三明]2023年福建三明市尤溪县招聘小学幼儿园新任教师79人笔试历年参考题库附带答案详解.docx
- [哈尔滨]2023年黑龙江哈尔滨市木兰县调配事业单位工作人员笔试历年参考题库附带答案详解.docx
- [上海]2023年上海市气象局所属事业单位招聘笔试历年参考题库附带答案详解.docx
- [台州]2023年浙江台州椒江区招聘中小学教师40人笔试历年参考题库附带答案详解.docx
最近下载
- 第15课 两次鸦片战争 教学课件(共31张PPT)高中历史人教统编版中外历史纲要上册.pptx VIP
- 电子课件-《GSP实务教程》课题七.pptx VIP
- 电机与电气控制技术 任务后练习题参考答案 赵红顺 .pdf
- PEP人教版小学英语六年级下册教案 全册.pdf VIP
- [北京]2024年北京市文物局局属事业单位招聘笔试历年参考题库附带答案详解.docx
- 【课件】平移(课件)人教版(2024)数学七年级下册.pptx VIP
- 电子课件-《GSP实务教程》课题六.pptx VIP
- 部编版道德与法治五年级下册《读懂彼此的心》练习题.docx VIP
- 《研学旅行课程设计》课件——研学课程方案设计.pptx VIP
- 《Lagrange中值定理.ppt
文档评论(0)