- 1、本文档共10页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
躲不开的大数据
提起大数据,很多人都有一个误解,过去我们认为,随着
人类信息记录技术和传输技术的发达,以及成本越来越低,
我们的数据记录就从一些小数据慢慢变成一个巨大的数据
包,大数据是这样吗?错!大数据的本质不在于它的大,而
在于它的全!我们是通过多维的、多角度的记录一个世界,
或者一个人的真相和行为轨迹,我们来判断它原本的本来面
目。
很多人一提大数据,就把它当做一个高大上的事物来对
待,其实所谓的大数据,更多的是一种理念,今天,我就将
我对大数据的理解和大家做一个分享。(1’02”)
【Part1】
大数据有一个关键词,叫做“交叉复现”,或者叫做“交
叉复用”。什么意思呢?我举一个例子。
在时装界有个大品牌叫Prada,它在纽约的旗舰店最近几
年就搞了一个小改革,每一件衣服上都有一个芯片,当这件
衣服被拿到试衣室的时候,试衣室有一个记录仪,就记录一
次,说明这件衣服进过试衣室,但这件衣服是不是被买了,
这个探测器不管。过去的所谓的商业数据就是进、销、存,
我进货多少、销出去多少、库存有多少,它只记录这些信息,
这叫大数据吗?这不叫大数据,因为它虽然数据量非常大,
但是它记录的是一个单维信息,可是当Prada做了这个小实
验,虽然只记录一个并不太大的一个数据规模,但是由于它
角度变了,于是大数据的规模就突然一下出来了,大家想啊,
原来Prada只能知道我哪件衣服好销,但是有一类衣服是这
样的,大家一看很喜欢,摘下来到试衣间试,试完了之后,
因为某种缺陷,大家把它撂下了,没买,所以当这两个数据,
就是柜台边的销售数据和试衣间里面的试衣数据,两个一
碰,Prada就能找出一些衣服的地款型,它们很好看,第一
感觉很好,但是卖不掉,一定是因为有什么缺陷,把这个缺
陷改进完了,等于Prada就马上多了几款热销的品种,所以
在商业上,这样多维的交叉复现就这样用起来了。(2‘07”)
再比如说,互联网金融,虽然现在学术界对其争论非常多,
但它一定是一种先进的方式,因为它正在用大数据的方法,
一点一点地去逼近在传统社会中要用极高的成本去解决的
一个问题,就是信用差别。传统的银行要决定给一个贷款客
户办理贷款业务,这得下多少功夫啊!这得老师傅带一个团
队,做各种各样的调查,最后发现信用不错,我们放心把钱
借给你。可是在互联网时代,所有的信用判别,要用大数据
的方法,它的成本会低到不像话,比如一家互联网金融公司,
他做P2P的贷款,你要找这家公司贷款,它只要你填一个简
单的表格就行了:姓名、住址、电话号码、你的单位、你的
工资卡的卡号,就是证明有人正常给你发工资,你有基本的
信用记录,就行了!你申请贷款几万、几十万,就这么给你
了!那你说这不是不负责任嘛?对,在传统社会看来,这就
叫不负责任,但在大数据时代来看,未必如此。他可以通过
多个信息、通过交叉复现得知你很多东西,比如说你的住址,
这是不是一个好的小区,你住不住得起好房子?那你说我填
一个假地址行不行?不行的!大数据交叉验证,它可以到你
微博上看呀,看你微博在哪儿发,因为发微博,最多的可能
性一个是家、一个是单位,你如果有单位,因为你有工资卡,
对不对?那另外一个点,发微博最多应该就是你家,那你常
住的地址和你填的这个地址是不是吻合,这就是交叉去验
证。然后再比如说,它能够知道你每个月交的电费,它就知
道你家里的电器的使用量,这基本上也可以衡量出一个人的
生活水平和收入水平。再比如说,它知道你的电话号码,那
你电话费交的情况是怎么样呢?你买这个电话是分期付款
还是一把付掉的呢?你用的电话是一种什么类型的电话
呢?等等。所有这些信息通过交叉验证,就又能呈现出来。
甚至在洛杉矶,有一家专门就做给那种叫高风险贷款,就是
你没啥信用记录,或者信用记录不好的人,我给你放贷款,
这家公司就用了很多大数据的手段,它甚至细到什么程度,
比如说你在银行,你总要填自己姓名吧,它就看你怎么填,
它不会告诉你的。你如果全是小写,这是一种很不规范的填
法,说明你这个人有点粗枝大叶;如果你全是大写,说明你
这个人有点狂妄自大。那最标准的填法是什么?首字母大
写,后面小写。就说明你这个人很精细,那很精细的人通常
来说,你的信用度要好那么一点点,那它就把这一点点记入
对你信用的判别的整体的数据库,人家监控的就这么细!洛
杉矶这家公司试验下来,它的坏账率比同样做这一行,但是
没有用大数据的整个坏账率要低60%!这是我用最简单的方
法给
文档评论(0)