基于专利数据的大数据技术发展研究.docxVIP

基于专利数据的大数据技术发展研究.docx

  1. 1、本文档共13页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

?

?

基于专利数据的大数据技术发展研究

?

?

赵向阳王亮梁晨院

摘要:全球范围内,运用大数据技术推动经济发展、完善社会治理、提升政府服务和监管能力正成为趋势。因此,对大数据技术进行梳理和分析有着十分重要的现实意义。而专利分析法作为一种常用的分析方法,通过对专利说明书、专利公报中大量零碎的专利信息进行分析、加工、组合,将这些专利信息转化为技术情报,为各方的相关决策提供参考。本文通过对大数据相关技术产业相关发明专利的申请情况、地区分布情况、申请人(权利人)分布情况等的分析,从数据层面清晰反映了大数据技术产业的创新能力、发展状况、发展阶段和发展趋势。

关键词:大数据;专利;技术路线

:TP311.13:ADOI:10.3969/j.issn.l003_6970.2017.08.037

概述

大数据不是具体的方法,甚至不算具体的研究学科,而只是对某一类问题、或需处理的数据的描述。通俗地来说,大数据是指无法在可承受的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合。根据Gartner公司的定义,大数据是大量、高速、及/或多变的信息资产,它需要新型的处理方式去促成更强的决策能力、洞察力与流程优化能力。而大数据的概念自诞生以来并非一成不变。大数据公认的特征3V是2001年由METAGROUP公司的分析员莱尼提出的,莱尼在一份报告中对大数据提出“3-D数据管理”的看法,即数据成长将朝3个方向发展,分别为数据即时处理的速度(Velocity)、数据格式的多样化(Variety)与数据量的规模(Volume),三者统称为“3V”0后来,随着时间的推移,人们对大数据有了更深入的看法,因此,对大数据的特征进行了相应的调整。2012年,包括IBM、国际调查机构Gartner、IDC等纷纷对大数据提出新的论述,将3V的概念扩展为4V,在原有的基础上增加了数据的真实性(Veracity)。此后,大数据的概念又在4V的基础上增加“Visualize”、“Value”、“Vast”

而扩展为6V甚至7V。随着大数据技术的发展,大数据技术越来越广泛的被应用于社会生活的方方面面,因而通过分析专利信息挖掘,从数据层面反应目前大数据技术和产业的发展状况和趋势具有重要的意义。

1大数据技术专利分析

1.1数据采集范围及相关说明

本文的外文数据检索于德温特数据库(DWPI数据库),中文专利数据检索于中国专利文献数据库(CPRSABS数据库),数据采集时间截至2015年12月。利用专业专利分析工具进行数据分析和数据深度挖掘。

同一项发明创造在多个国家申请专利而产生的一组内容相同或基本相同的文件出版物,称为一个专利族。从技术研发角度来看,属于同一专利族的多个专利申请可视为同一项技术。本文中,进行技术分析时对同族专利进行了合并统计,针对国家分布进行分析时各件专利进行了单独统计。

在进行专利申请数量统计时,对于数据库中以一族(这里的“族”指的是同族专利中的“族”)数据的形式出现的一系列专利文献,计算为“1项”。以“项”为单位进行的专利文献量的统计主要出现在外文数据的统计中。

在进行专利申请数量统计时,为了分析申请人在不同国家、地区或组织所提出的专利申请的分布情况,将同族专利申请分开进行统计,所得到的结果对应于申请的件数。1项专利申请可能对应于1件或多件专利申请。

1.2技术分解

由于大数据涉及的技术种类较多,技术复杂多变,且在教科书以及专利分类体系中均没有现成的大数据的分类体系可供参考。因此,在综合考虑了现有的主流大数据平台架构以及数据处理的流程,對大数据技术进行如表1的技术分解。

1.3大数据技术专利申请态势

基于上述的技术分解,采用CPRSABS和DWPI数据库进行检索,在上述两个数据库中共检索到专利32120项。

从图2可以看出,大数据领域的专利主要集中于数据挖掘以及数据存储,数据计算的相关专利较少,只占到总申请量的8.5%。数据挖掘专利中主要请集中于聚类算法、分类算法以及关联分析算法。数据存储专利主要集中于分布式块存储、分布式数据库以及分布式文件系统。

通过统计各项申请的优先权,大数据技术全球范围内专利申请的技术原创国分布如上图所示。优先权所属的国家/地区反映了申请人首次申请所属的国家/地区,折射了专利技术的起源,即专利技术的输出国家/地区,其数量也反映了相应国家/地区在相应领域的技术实力。从图2中可以看出,东亚地区、欧洲地区以及北美地区的主要国家均有申请,由此可见,大数据技术得到了众多科技发达国家的重视。同时,美国和中国的申请量最为庞大,远远多于其他国家,紧随中国及美国之后的是日本、欧洲国家以及韩国。

图3为主要五个国家/地区大数据专利申请的总体情况。横向比较,中国相关专利的年申请量已超过美国、日本、韩国以及欧洲,年申请量超过了1900

文档评论(0)

186****3950 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档