人工智能深度影响大数据产业.docx

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

??

?

??

人工智能深度影响大数据产业

?

??

?

?

?

?

?

?

?

???

?

?

?

?

?

人工智能深度影响大数据产业

■李论︱文

人工智能产业化序幕已经拉开

当前,人工智能进入了新一轮产业高速发展期。人工智能产业作为新兴的技术产业,正在引领全球各产业的技术变革,逐步成为传统产业结构转型的新方向。资本市场持续活跃、大量初创企业涌入、产业规模逐步扩大、技术水平快速增长等发展特点都表明了人工智能产业正在高速成长。2016年,GoogleAlphaGo打败围棋世界冠军李世石。2017年,AlphaGo升级版Master连胜世界围棋界各路顶尖高手60局。同年,Master在德州扑克游戏中战胜人类大师。在业界权威ImageNet图像分类比赛中,机器图像的分类错误率比人眼辨识错误率低1.53%,深度学习(DeepLearning)模型的识别能力已经超过了人眼。这些事件让我们意识到,部分智能技术能力已超越人类,人工智能进入可商用阶段。

本轮人工智能爆发的基础条件源于计算能力的大幅提升以及大规模数据的积累。现阶段人工智能发展的三驾马车主要为深度神经网络算法、高性能计算以及大规模数据。早在上世纪,神经网络算法就已经出现,但由于当时计算能力的不足以及可获取的数据较少,神经网络算法的学术研究受阻,人工智能陷入低谷。本世纪初,伴随着巨幅提升的硬件计算能力以及互联网高速发展带来的大规模数据,人工智能得以复苏,相关研究进展迅速。

深度神经网络算法的提出将人工智能从学术研究阶段大步推入了产业化阶段。2006年,Hinton提出了深度神经网络算法,在传统神经网络算法的基础上,深度神经网络算法借鉴了人脑的思考机理,将单层神经网络改造为多层叠加的深度神经网络,大幅提高了计算结果的准确度。相较于已有的传统学习模型,深度神经网络算法模型将特征提取自动化,去掉了模型设计中最难的环节之一。即使模型本身效果一般,通过大量数据对模型进行训练,仍会获得较好的结果。因此,深度神经网络算法模型的提出降低了研发人员进行模型设计的门槛,提高了高质量数据的价值。2012年,深度神经网络算法首次应用于图像分类,在正确率上取得了大幅提升。由于算法精确度的持续提升以及研发人员门槛的降低,使得资本市场、企业、高校纷纷看到了人工智能实用化的希望,人工智能开始从学术研究阶段大步迈入产业化阶段。

数据的规模和质量在一定程度上决定了当前人工智能的智能程度。现阶段,人工智能主要基于大规模、有标注的数据,通过深度学习算法进行学习。由于人类尚未能够对人工智能算法的学习机制进行合理的解释,而主流的深度学习算法主要依托大量数据进行学习,因此大量的高质量数据成为提升当前人工智能技术精准度的关键。

人工智能对大数据产业的影响

人工智能能够洞察大数据产业的潜在价值。大数据产业历经了数据、信息、知识的阶段,正在凭借着人工智能这一强大的驱动力,向智慧阶段转变。卡耐基梅隆大学计算机科学系教授曾说过:“大数据在未来会产生两方面作用,一是产生很多功能;二是展示更多机会,增大商业价值。将数据与AI结合起来,产生循环互动才是最理想的。”京东集团技术副总裁也表达过同样的想法:“在大数据中挖掘商业价值已经有大约20年了,大数据的下一步是与AI结合,提高人们决策的质量和思维的能力。”凭借人工智能的技术手段,驱动传统大数据产业转型升级,是产业发展的必然趋势。

人工智能为大数据产业带来新的数据要求。一方面,传统大数据产业中只有一部分数据能够有效用于人工智能。现阶段,传统大数据产业的数据可分为过程型数据和结果型数据。其中,过程型数据可以有效用于人工智能算法的学习训练。如智能投顾模型通过学习人工投资的操作数据,制定智能的投顾策略。AlphaGo通过学习人类下围棋的步骤数据,习得围棋规则。然而,结果型数据却不能有效驱动深度学习算法进行决策。如机器无法通过围棋大赛的结果排名学习如何下围棋,也无法通过传统PM2.5气象统计数据有效预测未来的空气质量情况。另一方面,人工智能所使用的数据具备大样本量、有反馈的数据特点。当前,人工智能处于专用感知智能阶段,需要大量垂直领域数据进行训练,小样本很难适用于当前人工智能的算法训练。如在Google著名的猫脸识别案例中,猫脸识别模型的训练数据集需要1000万张200×200像素的猫脸图片。此外,训练数据需要明确的数字化反馈,让机器不断优化自身算法模型。如Facebook通过让用户反馈是否喜欢其推送的信息,不断优化模型的精准度。AlphaGo通过习得不同棋局的输赢反馈,提升自身的围棋能力。

依托计算机视觉、自然语言处理等人工智能技术,视频、语音等非结构化数据的深度挖掘成为可能。在视频数据方面,依托图像识别技术手段,输入有哪些信誉好的足球投注网站目标的衣服颜色、衣服类

文档评论(0)

152****7564 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档