- 1、本文档共16页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
?
?
中国人工智能政策主题热点及演进分析
?
?
张涛马海群
关键词:人工智能政策;主题热点;主题演进;机器人;LDA
在大数据、算法和计算能力三大核心要素和经济社会发展强烈需求的共同驱动下,人工智能进入高速发展阶段。世界各国已经把发展人工智能作为提升国家竞争力的重大战略,我国也高度重视人工智能发展,不断通过出台国家战略来推动人工智能的发展,其中2017年国务院发布的《新一代人工智能发展规划》(以下简称规划)是我国人工智能发展的顶层设计,该政策为未来我国人工智能发展指明了方向。在此之后,各地区密集制定并出台了关于人工智能产业发展的发展规划、行动计划、实施方案等政策文件。在2019年3月政府工作报告中首次提出“智能+”概念后,人工智能快速与经济社会各领域相融合。2021年3月国家公布的十四五发展规划中“智能”“智慧”“机器人”相关表述达到59处,这表明以人工智能为代表的新一代信息技術将成为推动我国经济高质量发展重要技术保障和核心驱动力,而制定具有中国特色的人工智能战略不仅可促进人工智能产业的可持续发展,还可提升我国人工智能领域的国际话语权和规则制定权。因此,对我国人工智能政策主题热点及演进趋势分析具有重要的现实意义。
1相关研究
经过文献调研发现,国内研究成果分为两类:第一类,人工智能政策内容分析。吕文晶等[1]采用内容分析法对当前中国人工智能政策制定的现状与问题进行计量与分析。李良成等[2]通过构建三维政策分析框架对人工智能政策进行定量分析。王兆祥等[3]从政策结构与创新类型两个维度对我国人工智能政策文本进行分析。章小童等[4]对我国10项人工智能发展政策文本进行主题分析。郑烨等[5]对中外人工智能政策研究文献中热点主题及演进趋势进行深入探索。第二类,人工智能政策比较研究。如笔者[6]对《规划》和我国20个地区发布的人工智能规划纲要进行比较分析,发现了政策制定的相似性及差异性。贾开等[7]对美国、英国、德国、中国人工智能政策框架的主要特征进行了归纳与比较。高杰等[8]通过对中德两国人工智能政策与战略进行对比分析。毛子骏等[9]以政策工具为视角,对中、美、日、英、法5国的人工智能政策进行比较分析。汤志伟等[10]从3个维度选择17个政策变量,运用二元回归方法比较中美两国人工智能产业政策的差异。李明等[11]基于三维分析框架对我国央地政府人工智能政策进行比较研究。国外对人工智能政策研究成果相对较少,如:ChatterjeeS[12]通过对政府、企业的人工智能报告分析为印度的人工智能政策框架提供建议。RaoS等[13]提出人工智能政策需积极促进产业发展,但要审慎监管并应对存在的安全隐患。YangHT[14]提出政府要从政策制定角度出发,提高人工智能的透明度,完善与隐私和责任相关的法律制度。LauterbachA[15]介绍了人工智能的关键技术、风险和战略的发展趋势,通过社会治理框架来确保人工智能的安全性。
综上所述,近年来国内外对人工智能政策研究主要以内容分析和比较分析为视角,而利用政策文本计算方法对人工智能政策主题热点及演进趋势的研究成果较少。因此,文章以LDA主题聚类和主题相似度计算视角,对我国138部人工智能政策主题热点及演进进行分析,以期更好地把握我国人工智能政策发展脉络,为人工智能产业有序发展提供有力支撑。
2研究框架
2.1研究过程
在选取样本时精确查找团队自建语料库[16]中标题带有“智能”“智慧”“机器人”字样的138条政策文本,政策发布时间范围为2010—2021年,政策主要包括规划纲要、实施意见、实施方案、条例、管理办法、规定、标准等,政策文本语句片段共22436条,字符数共1271680个,研究过程如图1所示。
1)研究对象:将138部人工智能政策按政策发布时间和层级划分。
2)预处理:利用ICTCLAS新词提取结合自建语料库中政策词表提取852条政策词语,去除“发展”“建设”等一些无实际意义的高频词语,利用Jieba分词,形成待分析文本。
3)LDA主题聚类:利用Python中Gensim库LdaModel函数建立主题模型,将预处理后的文本数据进行主题聚类[17],将2~20区间内的整数作为候选主题数,通过调用LDA主题模型中Log_Perplexity方法[18]得出不同主题对应的困惑度数值,将困惑度最小值确定为最优主题数,实现主题热点提取。
4)主题相似度计算:利用Python中Gensim库BOW模型和TF-IDF模型对不同维度主题相似度进行计算[19],主题相似度数值越高,则相似性越大,数值越低,则差异性越大,为便于发现主题演进走向,利用Python中PyeCharts库生成桑基图形成可视化效果,线条较粗代表主题间相似度高,线条较细代表主题间相似度较低,通过桑基图可以清晰发现不同阶段人工智
文档评论(0)