- 1、本文档共6页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
大数据比想象的不靠谱:数据驱动背后的谎言与欺骗
每天早晨我都在谎言中开启新的一天。
起床后我走进卫生间,称了一下自己的体重。这个数据会从中国制造的体重秤上同步到我手机中的
App 里面,并且最终进入苹果的数据库,我的体重数据将永久地存放在云端。
我进行这个称量体重的仪式是因为感觉它能迫使我对于自己的体重保持诚实。它会阻止我找借口欺
骗自己,比如说衣服不合身是因为洗的缩水了,而不是因为吃下去太多啤酒与奶酪。这些体重数据
是真实无误的,它们不是出自于我的主观判断,因此体重秤是不会说谎的。
当然了,我们都相信体重秤显示的数字从技术层面上来看不应有假,这个数字就是当下我的真实
体重,它就如同蛋糕菜谱上的配方表里的数字一样是可靠的。
但是在一次次的称体重中你会发现,那个决定了一个人是标准还是臃肿,是瘦削还是肥胖的体重
数字,其实是很容易被操纵的。
如果我想让自己轻一些,我就会在上称之前出去跑步流一身大汗,排出多余水分。如果我担心自己
减的太猛已经超出了健身方案制定的标准,那么我就需要重新回到健康饮食当中,推迟称重的时间
,补充食物与充足的水,这样子就可以看到体重数字又有所回升。
当然了,你所使用的这些干预体重的方法只会带来增减 5 磅(约为 4.5 斤)左右的差别,但是对于
某些和我一样对于体重无比看重的人来说,这些小小的体重数字波动已经足以让我感觉自己确实有
所转变,从这个人 ? :
变成了这个人 ?
你也许觉得这只是个人生活方面的数字欺诈,世界上的其他数据,比如说发表在公开学术期刊上的
数据总没那么容易被人为操纵吧。
不过如果你看到了最近刊登在美国权威学术期刊《科学》上面的一项研究,或许就不会这么认为了
。该项目的研究人员对于已发表的 100 篇高质量心理学论文中进行的实验进行了复制,看看是不是
能够得出相同的数据,而实验结果是仅仅有 36% 的数据可以重现。换句话说,就算是换了另一批
小心翼翼且专业的研究人员,也有三分之二的论文结果是不能被重现出来的。
「这个研究项目为我们提供了不少证据,了解到在很多心理学研究论文中发现的结论仍然需要细致
的工作去反复检验,看看这些结果到底是不是像我们知道的那样确定。」
在如今的很多研究领域当中,科学家们会一直收集数据,直到数据呈现出一种在统计学上显著的
模式,然后他们会使用这些经过严格挑选的数据去发表论文。在学术圈里这种做法被称作是「 P 值
篡改」( p-hacking ),只要掌握一些数据操作的技巧,就可以让数据虚高,得出一个在统计学上显
著且有意义的结果。在论文中常用的篡改数据的手法如下:
当这些有问题的研究结论进入到 Facebook 驱动的社交媒体世界当中时,即便是一个小小的「 P 值
篡改」的研究也会迅速传遍世界,而且不会有多少人表示怀疑。当一个普通人在快速浏览新闻的时
候不会意识到那些「科学实验得出」、「研究表明」其实就是扯淡,其研究结果根本经不起检验,
尤其是当这些说法出现在学术期刊上,就更不会引发怀疑了。
这就是所谓专业的科学研究!如果在学术研究领域当中都存在着数据作假,那么就更别提在数据驱
动的商业领域情况会是如何了。
在令人啧啧称奇的《国家的视角》( Seeing Like a State )一书中,展现了各国政府与其他大型机
构如何试图减少世界当中存在的极端复杂性,将其归为统计数据可以解释的范畴里,并使得其国家
或者组织的领导人能够理解到底发生了什么。
作者 James C. Scott 在全书开头使用了一则历史当中真实的故事作为引子。在 18 世纪下半叶,普
鲁士的统治者们想要知道在自己森林茂密的国家中到底拥有多少「自然资源」。因此他们就开始着
手计算了,他们在自己国家的版图上画出了一个巨大的表格,这样就可以算出来在一个划定的森林
范围当中可以产出多少板尺(译者注:硬木板材的计量单位)的木材。至于森林的其他价值,比如
说为人类和动物提供庇护,以及自身拥有的生态环境价值都被忽略不计。
真实的世界并不那么守规矩,普鲁士统治者们得到的数据总是不完美。因此他们开始自己创造新的
森林,在相同时间种下单一品种的树木,这样在森林当中就不会存在无法货币化的树木了。「事实
就是在这种几何图形的森林规划背后有着国家力量的支撑,这种力量将原生的、真实的、包含多个
物种且略显混乱的森林变成了新型
您可能关注的文档
- 大三找实习简历模板.pdf
- 大扫除小学生优秀作文10篇.pdf
- 大扫除作文600字(精选8篇).pdf
- 大厦外幕墙工程单元体炮车吊装方案设计.pdf
- 大厦物业管理方案书.pdf
- 大设计时代必威体育精装版分析和总结.pdf
- 大神带你做APP海外推广(下):世界那么大,你不想去看看么?.pdf
- 大时态综合练习题.pdf
- 大势所趋!移动版专题设计的那些事.pdf
- 大手牵小手——综合实践的教案.pdf
- 东海证券-轮胎行业月报:2024年高景气收官,节后开工恢复性提升.pdf
- 东吴证券-环保行业跟踪周报:欧盟终裁略下调对华生柴反倾销关税,开始跟踪SAF进口,持续推荐现金流资产.pdf
- 北京博观众智信息科技-日本保健品行业繁荣发展的背后及发展现状.pdf
- 兴业证券-电力设备行业深度报告:机器人业务打开锂电精密加工企业成长空间.pdf
- 信达证券-航空运输月度专题:1月油汇向好、国内线运力同比微增,客座率高位维稳.pdf
- 兴业证券-德昌股份-605555-家电汽零双轮驱动,多元布局兑现高成长.pdf
- 东吴证券-九方智投控股-09636.HK-基本面夯实乘A股东风,AI赋能拓成长蓝海.pdf
- 民生证券-计算机行业深度报告:DeepSeek系列报告之AI+医疗.pdf
- 兴业证券-基础化工行业周报:国常会研究提振消费及化解重点产业结构性矛盾继续关注化工核心资产及新材料成长.pdf
- 国金证券-A股投资策略周报:港股“狂飙”背后:哪些驱动因子与A股不一样?.pdf
文档评论(0)