《构建文献资源知识图谱 技术要求》编制说明.pdf

《构建文献资源知识图谱 技术要求》编制说明.pdf

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

中国计算机用户协会团体标准

《构建文献资源知识图谱技术要求》

(征求意见稿)编制说明

一、标准编制的背景

随着信息技术的快速发展和互联网的普及应用,知识图谱作为一种结构化知

识表示和组织方法,在各个领域的知识管理和智能应用中发挥着越来越重要的作

用。知识图谱是实现文献资源智能应用的重要基础,同时利用大语言模型在语义

理解、内容生成等方面的技术优势,实现大语言模型对知识图谱构建至知识图谱

应用各环节的增强,提升图谱构建效率和图谱质量。在实际应用中,为了保证知

识图谱的质量和可用性,需要制定一套文献资源知识图谱构建的标准流程。

知识图谱的构建是一个逐步迭代的过程,需要不断地添加新的领域知识和实

体关系;同时知识图谱的构建也是一个持续的过程,需要不断地更新和维护,因

此需要一个统一的标准,以保证知识图谱构建过程的一致性,从而提高知识图谱

的质量和可用性。而目前行业尚未有明确知识图谱构建过程标准,因此本文件是

文献资源知识图谱构建过程的重要指导,也将为各行业知识图谱的构建过程提供

重要参考。

二、任务来源

根据中国计算机用户协会下达的2023年下半年第一批团体标准制修订计划,

中南出版传媒集团作为主要牵头单位筹建了标准起草组,承担《构建文献资源知

识图谱技术要求》标准的研制任务。该标准的立项计划号为T/CCUALX012-2023,

技术归口单位为中国计算机用户协会。

三、编制过程

2023年08月标准起草组开始起草《构建文献资源知识图谱技术要求》团

体标准立项申报书,经过内部多次讨论,完成立项申报书。

2023年11月标准起草组参加了计算机用户协会标委会组织的《构建文献资

源知识图谱技术要求》团体标准立项申报项目的立项论证会议。听取了与会专

家的意见与建议,修改完善立项申报书。

2023年12月立项申报通过,标准起草组开始正式起早《构建文献资源知识

图谱技术要求》团体标准,2024年03月,标准起草组完成了标准草案的初稿。

2024年04月开始在起草组评审委员会内进行评审。共经历了1次组内评审,

期间收到了9条意见。起草组根据评审意见讨论修改后,形成内部征求意见稿,

4月18日送交中国计算机用户协会标准化工作委员会审核。

2024年05月根据预审专家评审意见对《构建文献资源知识图谱技术要求》

团体标准征求意见稿进行了修改,5月29日再次送交中国计算机用户协会标准

化工作委员会审核。

2024年06月根据计算机用户协会标委会反馈意见对《构建文献资源知识图

谱技术要求》团体标准征求意见稿进行了修改,6月18日送交中国计算机用户

协会标准化工作委员会审核。

四、编制原则

标准的用语、格式按照GB/T1.1-2020给出的规则起草。

标准内容的编制坚持以下原则:

1、科学性原则

2、规范性原则

3、实用性原则

4、前瞻性原则

5、持续改进原则

6、符合知识图谱行业发展需求

7、符合实际应用需求

五、标准主要内容

本标准规定了文献资源领域的知识图谱构建要求。

本标准适用于对文献资源知识图谱构建过程的全流程管理。

六、有关技术的说明

有关本标准起草过程中的一些技术问题说明如下:

1、数据接入与清洗

数据接入与清洗是在选择明确的文本数据源基础上,通过数据清洗和其他预

处理方法,消除数据中的噪声和异常值,进一步提高数据的质量和一致性。

2、数据整合和处理

数据整合与管理包括数据格式转换、数据归一化和数据集成等。首先将不同

来源的数据统一为构建知识图谱所需的格式。其次,数据归一化确保数据中的实

体和属性具有统一的表示,消除歧义。最后,数据集成将处理后的数据融合为一

个整体,为后续的知识图谱构建和分析提供坚实的数据基础。

3、知识模型构建

知识模型构建可建立知识图谱的概念模型,即采用什么样的方式来表达知识,

构建一个概念模型对知识进行描述。知识模型构建的过程是知识图谱构建的基础,

高质量的知识模型能避免许多不必要、重复性的知识获取工作,有效提高知识图

谱构建的效率。

4、知识抽取

知识抽取依赖于文献资源中的信息,借助自然语言处理等技术进行实体识别

和关系抽取。实体抽取旨在从文本中识别并提取出具有实际意义的实

文档评论(0)

***** + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档