网站大量收购闲置独家精品文档,联系QQ:2885784924

大数据安全变革期末科技素养课作业.doc

大数据安全变革期末科技素养课作业.doc

  1. 1、本文档共11页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
大数据时代的 生活变革 专业:电子商务 丁宇 在文章的开头,请容许学生简单解释下自己的专业背景,我主修电子商务专业,以前曾经主修过生物科学专业,在理工科的学习让我深刻理解到数据收集和处理对科研的重要性,而在修习电子商务方面的知识时,学生更多接触到电商通过利用数据,分析买家的特点以及偏好,进行更好的生产以及个性化营销,更好地服务者我们的生活(在今天,网购成瘾需要避免,但是网购的优越性确实无法忽视),学生逐渐体会到数据也正改变着我们的生活。 事实上,数据是一直存在和服务着我们的生活的,但是今天的数据在互联网法则下似乎更加强大和无所不在。我们使用和分析数据的初衷是得到有效的结论,从而为我们以后的生活提供指导和服务。但囿于技术手段的发展,我们常常会对数据进行抽样后再通过一系列的数据处理手段得到想要的??论,这些结论会更接近于真理,但是往往更背离于事实。就像黑天鹅理论中所说,黑天鹅尚未发现之前一切基于黑天鹅不存在这一假设的结论一切都是正确的,直到黑天鹅出现,一切归于幻影。当然我们也不可以否认,科学发展史上,很多看似是谬误的结论和数据偏差可能正是事实所在。科学是忠于真理的,而真理必须趋于事实。在云计算技术得到发展之后,科研的计算能力和质量得到的质的飞跃,处理更多的数据,拟合更真实的模型已经是可能实现的了,发明更好的算法,处理更多的数据,接触更真实的世界,在最浩大的计算里,重新挖掘数据,使这些数据完整我们的现在和未来,大数据应运而生。 以下援引百度百科对大数据的定义:大数据(big data),或称巨量资料,指的是所涉及的资料量规模巨大到无法透过目前主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。(在HYPERLINK /view/9716309.htm维克托·迈尔-舍恩伯格及肯尼斯·库克耶编写的《HYPERLINK /view/9424571.htm大数据时代》中大数据指不用随机分析法(抽样调查)这样的捷径,而采用所有数据的方法)大数据的4V特点:Volume、Velocity、Variety、Veracity。 事实上,最早提出“大数据”时代到来的是全球知名咨询公司HYPERLINK /view/1013977.htm麦肯锡,麦肯锡称:“数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来。” “大数据”在HYPERLINK /view/15707.htm物理学、HYPERLINK /view/7868.htm生物学、HYPERLINK /view/474487.htm环境生态学等领域以及军事、金融、通讯等行业存在已有时日,却因为近年来互联网和信息行业的发展而引起人们关注。 空谈大数据的概念可能让人感到乏味,我们不妨来看一些事实: 变革公共卫生。 2009年,H1N1病毒。在甲型H1N1流感爆发的几周前,互联网巨头谷歌公司的工程师们在《自然》杂志上发表了一篇引人注目的论文。它令公共卫生官员们和计算机科学家们感到震惊。文中解释了谷歌为什么能够预测冬季流感的传播:不仅是全美范围的传播,而且可以具体到特定的地区和州。谷歌通过观察人们在网上的有哪些信誉好的足球投注网站记录来完成这个预测,而这种方法以前一直是被忽略的。谷歌保存了多年来所有的有哪些信誉好的足球投注网站记录,而且每天都会收到来自全球超过30亿条的有哪些信誉好的足球投注网站指令,如此庞大的数据资源足以支撑和帮助它完成这项工作。 谷歌公司把5000万条美国人最频繁检索的词条和美国疾控中心在2003年至2008年间季节性流感传播时期的数据进行了比较。他们希望通过分析人们的有哪些信誉好的足球投注网站记录来判断这些人是否患上了流感,其他公司也曾试图确定这些相关的词条,但是他们缺乏像谷歌公司一样庞大的数据资源、处理能力和统计技术。 虽然谷歌公司的员工猜测,特定的检索词条是为了在网络上得到关于流感的信息,如“哪些是治疗咳嗽和发热的药物”,但是找出这些词条并不是重点,他们也不知道哪些词条更重要。更关键的是,他们建立的系统并不依赖于这样的语义理解。他们设立的这个系统唯一关注的就是特定检索词条的使用频率与流感在时间和空间上的传播之间的联系。谷歌公司为了测试这些检索词条,总共处理了4.5亿个不同的数学模型。在将得出的预测与2007年、2008年美国疾控中心记录的实际流感病例进行对比后,谷歌公司发现,他们的软件发现了45条检索词条的组合,将它们用于一个特定的数学模型后,他们的预测与官方数据的相关性高达97%。和疾控中心一样,他们也能判断出流感是从哪里传播出来的,而且判断非常及时,不会像疾控中心一样要在流感爆发一两周之后才可以做到。 而在这一事件中,大数据的及时性和准确性比较与传

文档评论(0)

jdy261842 + 关注
实名认证
内容提供者

分享好文档!

1亿VIP精品文档

相关文档