- 1、本文档共59页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
大数据改变未来吴军美国约翰·霍普金斯大学计算机博士课程前言 我们今天就聊聊一个比较热门的话题—大数据。这个词啊Big data或者叫大数据,在中国现在真是非常非常的热。有人说它可能是一个泡沫,有人说它可能会改变世界,那么它到底会是什么样子呢?说它是泡沫的一般认为是这样子,就是说我们到目前为止,我们还没有看到,说这个大数据给我们产生多少的GDP,好象很多人也没有发现,就是说它跟我们人类生活到底有多大的相关性,因为亲身生活没有体验到这一点,那么是否真是这样子的话,我们不妨来看看什么是大数据?它真正的可怕之处在哪里?以及有了大数据我们的未来社会未来生活会是什么样子的?一、未来是数据为王的时代 在过去的五十年里,人类整个的发展根本的这个动力从科技的角度来讲,就是一个摩尔定律,什么意思呢?就是在1965年的时候,英特网公司后来的创始人摩尔先生,他提出来在今后的十几年里,半导体处理器的性能,比如说容量、计算速度和复杂程度每18个月左右可以翻一番。他也没有预想到这件事一直发生了五十年。以至于人整个人类发生了天翻地覆的变化。可以这么讲,我们过去的整个的社会的科技进步工业进步以及这个GDP的提升都是靠这个摩尔定律,如果我们把这个摩尔定律带来的电信化从过去五十年中拿去,我们会发现我们可能GDP不但没有增加,而且还在减少。那么这是过去五十年的情况。 在今后二十年它又会往哪儿走呢?在未来的二十年里,什么决定世界经济发展的方向?我认为如果说过去五十年是摩尔定律的时代,未来二十年就是数据为王的时代。 大数据会带来机器智能,也就是说让我们的计算机变得非常聪明,以至于它超过我们人类的智能。为什么这么说呢?我们刚才讲了,计算机的发展速度本身是一个指数增长,而我们人的智能的发展速度是一个线性增长,甚至还会稍微慢一点,那么一定在某一个时间点,它会重合。 今天可能就是这个重合的时间点,那可能你又会问了,为什么正好在这个时间点上,我们会有这么多的数据?一个是互联网的收集和积累,再有一个就是今天各种传感器,各种智能设备,各种监控设备,它们无时无刻地不在为我们提供大量的数据。而在我们过去,因为存储量计算量不够的时候,我们把这些数据都抛弃掉了,不是说这些数据在过去不存在现在存在,只是说我们现在因为半导体事业的发展,我们有能力,有可能来存储和处理这样一些数据。 在讲这个机器智能以前,我们就首先要说说,什么是机器智能?我们都知道1946年人类第一台电子计算机诞生了,名字叫做ENIAC诞生。那台计算机其实计算速度只有一秒钟五千次,大概是你的手机计算速度差不多可能几十万分之一,那么计算机诞生后不久,人类其实就开始考虑,说既然这个计算机计算速度能这么快,它能不能产生一些智能? 所以五十年代初的时候,计算机老祖宗阿兰图灵就提出了一个叫图灵测试的概念。什么意思呢?就是说在屏幕后面,我放一台机器放一个人,然后我们谈一个问题,比如说天为什么是蓝色的?计算机给一个,人给一个,给出的答案让我来判断,说哪一个计算机给的?哪个是人给的?如果我判断不出来,哪个答案是计算机给的或者是人给的,已经能够把这两个答案要混淆起来了,我就认为机器和人一样的智能。人类为这个目标做了20年,这20年的发展非常不顺利,到了1970年基本上计算机还做不了任何具有智能的事情。为什么会产生这样的问题呢?或者说这20年研究为什么会走弯路呢?主要是我们完全地按照人的方式去理解机器,没有完全按机器的方式理解人。 举一个例子,预测美国总统选举结果这么一个例子,比较著名的大家可能听说过盖洛普这样一个预测公司,那么它实际上是用一些传统的抽样的统计方法做一些预测,有时灵,有时不灵。即使正确的时候,基本上误差两到三个百分点,在全国范围预测能准,但是你知道竞选是一个州一个州这么算选票,它不是一人一票制。 所以它从来没有做到过美国50个州全部做对的,到了2012年,有一个毛头小伙子,这个人从来以前没有名,也不是什么了不得的科学家,他就做了一件事儿,他就在互联网上比如社交网络上,比如脸书上推特上,地方的报纸上大家的BBS上等等。凡是他能找到信息的地方,他就把信息都搜集起来,然后他做一次2012年美国总统选举结果的预测,50个州,他全部预测对了。这件事在过去是不敢想象的,从这里头你可以看出当这个数据完备了以后是非常可怕的。二、大数据是一种思维方式 大家不知道有没有注意到这个名字大数据Big data。为什么不叫large data?其实在英语里,它并不是说一开始随机的选这么一个词Big data就这么叫了,在英语里这个Big和Large虽然都是大的意思,但是有一个比较细微的差别,Big这个大是相对抽象一点的一个概念。Big Small大和小是这样子。那Large是体量大,比如我这张桌子很大,我说Large table。大数据所以更重要用b
文档评论(0)