- 1、本文档共74页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
中文摘要
基于离群专利的生物医药领域新兴技术探测
目的:
在新兴技术识别数据层面,针对离群专利展开分析,以期更加有效地识别新
兴技术。在新兴技术识别方法层面,采用机器学习算法构建新兴技术识别模型,
有利于大规模专利数据的智能化分析,提高新兴技术探测的准确性。从离群专利
视角出发,基于机器学习构建了一种基于专利综合价值的新兴技术探测方法,旨
在加深对新兴技术内涵的理解、拓展新兴技术的识别方法。在生物医药领域开展
新兴技术的识别探测研究,为生物医药领域内技术发展和变化趋势的分析提供参
考。
材料与方法:
首先基于文献调研法,梳理归纳既往相关理论研究,以技术领域内专利为基
础,设计有效的新兴技术探测方法,并验证方法的有效性。主要包括4个方面:
第一,依托技术领域专利数据库,通过大量的专利数据分析形成专利相似矩阵,
筛选出离群专利作为新兴技术候选专利数据集,第二,围绕新兴技术的特征,在
以往仅考虑个体属性的基础上,结合网络属性构建基于专利综合价值的新兴技术
识别指标体系,将体系中的指标作为新兴技术识别的输入变量,选取专利发展后
的被引频次和专利转让次数作为新兴技术识别的目标变量。第三,基于7种常用
的机器学习算法构建新兴技术识别模型,拟合输入变量和目标变量的关联关系,
并选出最优的识别算法。第四,将基于机器学习算法的最优识别模型得到的关联
关系推广到未来,对筛选出的含有可能发展为新兴技术的专利文本内容进行主题
分析,完成离群专利中潜在的新兴技术探测。
结果:
基于离群专利数据采用机器学习算法提出了一种新兴技术探测方法,利用生
物医药领域10年的专利数据进行验证,其中2012-2016年专利数据进行模型训
练,2017-2021年专利数据进行新兴技术探测;本研究对比了基于7种机器学习
算法构建的新兴技术识别模型性能,7种机器学习算法构建的识别模型性能都较
好,其中XGBoost算法相比较KNN、决策树、支持向量机、人工神经网络、
I
AadBoost、GradienBoostingClassfier算法,其构建的新兴技术识别模型性能更好,
XGBoost算法为首选的新兴技术识别算法;在新兴技术主题识别阶段,本研究识
别出肿瘤精准医疗、肿瘤类器官、新型冠状病毒检测和新型冠状病毒疫苗4个潜
在的新兴技术主题。
结论:
从离群专利的视角出发,采用机器学习算法构建新兴技术识别模型探测新兴
技术,基于专利相似度筛选出离群专利,根据新兴技术特征提出了基于专利综合
价值的新兴技术识别指标体系,并基于专利综合价值的新兴技术识别指标体系构
建了离群专利指标与新兴技术识别信号之间的关系模型,通过对领域当前的离群
专利进行探测识别潜在的新兴技术。
主要研究结论如下:(1)在生物医药领域的实证研究证明,依据新兴技术
早期特征,基于离群专利进行新兴技术的探测是有效的,对现有新兴技术探测研
究的丰富和拓展。(2)在新兴技术探测中,本研究拟合了高维度的专利指标和
新兴技术识别信号之间的非线性关系,筛选出了XGBoost算法为最优的新兴技
术识别算法。并初步地分析了各个指标在新兴技术识别过程中的作用,本研究提
出的方法有利于大规模专利数据的智能化分析,时间成本低,节省人力物力。(3)
通过对领域现状和发展趋势进行对比可以发现,识别出的生物医药领域潜在新兴
技术主题和预测出的新兴技术发展趋势与现实中的技术发展状况具有较高的吻
合度,从而验证了方法的有效性和可行性。
主要创新点如下:提出了一种基于专利综合价值的新兴技术识别指标体系。
与以往未结合网络属性的指标体系相比,将综合价值指标体系中的指标作为输入
变量时,模型性能在新兴技术识别任务中有明显的提升。
关键词:
新兴技术,离群专利,技术预测,机器学习,生物医药
II
Abstract
DetectionofEmergingTechnologiesinBiomedicalField
文档评论(0)