- 1、本文档共15页,其中可免费阅读8页,需付费100金币后方可阅读剩余内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,可选择认领,认领后既往收益都归您。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细先通过免费阅读内容等途径辨别内容交易风险。如存在严重挂羊头卖狗肉之情形,可联系本站下载客服投诉处理。
- 4、文档侵权举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
1 引言
随着信息技术的快速发展,各个领域都产生了大量的数据,数据量呈现爆炸式增长,大数据的概念逐渐形成。大数据的HACE(Heterogeneous,Autonomous,Complex,Evolving)法则认为大数据的特征之一是异构(Heterogeneous),即相同的实体数据来源不同,具有不同的数据内容构成、格式规范以及描述规范[1]。因此,在大数据时代,科技情报分析流程中的一个重要环节就是对异构数据进行规范化等处理,构建内容干净、结构规范的目标数据集,即多源信息融合与清洗[2,3]。在文献元数据的融合过程中,很重要的一个步骤是机构信息规范化。在机构信息规范化的基础上,才能够保证机构
您可能关注的文档
- HL7 FHIR框架下中国医疗领域信息交换研究与解决方案.docx
- RLCPAR:一种基于强化学习的中文专利摘要改写模型.docx
- 一对多实体关系少样本持续学习方法研究.docx
- 一种专利技术主题分析的IPC语境增强Context-LDA模型研究.docx
- 一种单分类器联合多任务网络的隐式句间关系分析方法.docx
- 一种基于CNN-BiLSTM多特征融合的股票走势预测模型.docx
- 一种基于异质信息网络的学术文献作者重名消歧方法.docx
- 一种用于实体关系三元组抽取的位置辅助分步标记方法.docx
- 一种融合表示学习与主题表征的作者合作预测模型.docx
- 上下位关系抽取方法及其在金融市场的应用.docx
文档评论(0)