网站大量收购闲置独家精品文档,联系QQ:2885784924

大数据和人工智能发展的思考.docx

  1. 1、本文档共15页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

大数据和人工智能发展的思考

10月12日,第七届中国智能产业高峰论坛在佛山开幕,在第一天的主论坛上,北京拓尔思信息技术股份有限公司副董事长、总裁施水才发表了主题为《大数据和人工智能发展的思考》的精彩演讲。

在演讲中,施水才先生从自身多年大数据技术和服务领导者角色的角度,介绍了旗下利用大数据技术推出的数据增值服务平台,并得出了“数据——信息——知识——智能——智慧”的价值提升路径。从大数据、云服务到人工智能,施水才为嘉宾铺设了一条如何利用大数据去实现人工智能增值的道路,有很大的参考价值。

施水才:大家上午好。非常感谢中国人工智能学会邀请我在大会上做分享报告。现在全国人民都在谈人工智能,但是在我心目中,中国人工智能学会才是我们国家人工智能学术殿堂,所以内心是非常忐忑的,我问自己,我有什么资格站在这里给大家做报告呢?因为我既不能说自己不懂技术,也没有一千个亿,可能是我们过去20多年也做了一些工作,包括有哪些信誉好的足球投注网站技术、文本挖掘技术、大数据技术及应用,并且是国内第一个以自然语言处理为主要高年的A股上市公司。今天我想给大家分享一下对于大数据和人工智能产业的发展思考。

我想讲的第一点是我认为把大数据和人工智能产业进行一些比对,把这两个事情放到一起比对是非常有意义的。第二点想讲的,到底我们是人工智能+行业,还是行业+人工智能,谈一下我的理解和认识,第三点我觉得我们需要突破人工智能现在非常强调3个要素,就是计算能力、数据和算法,我认为对于未来人工智能的研究和应用,仅有这三点是不够的,应该有其他重要的因素需要加进来。第四点我想探讨的是我们现在在人工智能的几个方向里面,哪一些还有大的机会,来让我们创新、创业、赚钱,最后讲一讲我们自己基于NLP平台的一些人工智能应用实践。

对比大数据和人工智能产业的发展是有启发的。因为人工智能的发展和数据密不可分,而且目前人工智能发展所取得的成就大部分和大数据密切相关,因此观察大数据产业的发展对人工智能产业发展很有意义,同时我们认为数据驱动的商业(DataDrivenBusiness)比智能驱动的商业更符合产业的本质,实际上大数据产业的落地能力是强于人工智能的,所以大数据产业发展中出现的问题对人工智能产业发展很有意义。

大数据的发展有几个方面对人工智能的发展有启发。包括数据的重要性,数据质量的重要性,应用场景的重要性,行业知识的重要性、政策法规的重要性,以及变现的模式的参考意义。大数据从2010年在美国白宫首先开始制定一些政策,到2012年我们国家开始热起来,这几年出台了很多政策规范,甚至搞了很多园区,但是我们现在发现整个大数据产业仍然处于非常早期的阶段。为什么这么说?第一,它在哪些方面推动了产业的变革?第二,谁赚到钱了?现在基本上只有互联网的大公司通过推荐精准化营销、电子商务等等赚到钱了,但是我们大量从事产业大数据的企业大部分还在烧钱,行业也没有从大数据中收益和发生大的产业变革,仍然处于非常早期阶段。人工智能也是一样的,大部分的AI企业仍处于投资和烧钱的阶段。

再细化一下,我们看看影响整个大数据产业发展的4个要素:数据开放、技术研发、产业生态、法律法规。总体上讲,目前大数据产业发展非常早期,仍然是大数据投资和创业的良机,在产业生态上主要的特征是垄断和新的数据孤岛,大数据创业公司仍需3-5年才能实现规模盈利,大部分在持续的烧钱,2017-2018年产业整合趋势明显。在数据方面,互联网大企业的数据霸权主义、政府数据公开的艰难(在国际上很落后,60名开外),行业和企业数据的难以获得以及灰色数据灰色产业链,以及个人隐私问题都非常的突出,我们国家每年数据交易的市场是500个亿以上,但是合法的只有10%左右,90%都是灰色数据链,所以导致最近公安查,说很多大公司被抓起来了,个人隐私问题非常突出,要破解数据的魔咒,需要在法律法规和产业生态两个角度去破局。

数据的质量问题很大,最近我们在做一个国家项目,发现这个数据的问题很大,行业的数据很难开放和共享。很多数据可能是无用的死数据,如工商企业数据中的僵死企业数据,比如说大家经常提到的,全国有七千万工商企业,其中三千多万的中小以上在运营,每天新创企业几万家,倒闭企业也有几万家,但是如果倒闭数据一直这里面,这些数据还有什么意义呢?再说互联网数据的低质量和低价值密度,第二互联网数据非常大,但是互联网数据有2个问题,第一质量很低,第二价值密度很低,对于大数据来说价值密度低一点没有关系,但是对于依赖于机器学习的人工智能来说,数据质量的重要性是个大问题。数据的另外一个问题是数据标准和规范不统一。

除了数据及数据的质量外,应用场景是非常重要的,大数据的4个V不重要,Hadoop/Spark不重要,重要的是应用场景,那么对AI来说也是一样的,因为实际上我们看到大数据和AI的热门应用领域实际上重合度很高

文档评论(0)

+ 关注
实名认证
内容提供者

好文件大家想

1亿VIP精品文档

相关文档