- 1、本文档共6页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
中国计算机用户协会团体标准
《构建文献资源知识图谱技术要求》
(征求意见稿)编制说明
一、标准编制的背景
随着信息技术的快速发展和互联网的普及应用,知识图谱作为一种结构化知
识表示和组织方法,在各个领域的知识管理和智能应用中发挥着越来越重要的作
用。知识图谱是实现文献资源智能应用的重要基础,同时利用大语言模型在语义
理解、内容生成等方面的技术优势,实现大语言模型对知识图谱构建至知识图谱
应用各环节的增强,提升图谱构建效率和图谱质量。在实际应用中,为了保证知
识图谱的质量和可用性,需要制定一套文献资源知识图谱构建的标准流程。
知识图谱的构建是一个逐步迭代的过程,需要不断地添加新的领域知识和实
体关系;同时知识图谱的构建也是一个持续的过程,需要不断地更新和维护,因
此需要一个统一的标准,以保证知识图谱构建过程的一致性,从而提高知识图谱
的质量和可用性。而目前行业尚未有明确知识图谱构建过程标准,因此本文件是
文献资源知识图谱构建过程的重要指导,也将为各行业知识图谱的构建过程提供
重要参考。
二、任务来源
根据中国计算机用户协会下达的2023年下半年第一批团体标准制修订计划,
中南出版传媒集团作为主要牵头单位筹建了标准起草组,承担《构建文献资源知
识图谱技术要求》标准的研制任务。该标准的立项计划号为T/CCUALX012-2023,
技术归口单位为中国计算机用户协会。
三、编制过程
2023年08月标准起草组开始起草《构建文献资源知识图谱技术要求》团
体标准立项申报书,经过内部多次讨论,完成立项申报书。
2023年11月标准起草组参加了计算机用户协会标委会组织的《构建文献资
源知识图谱技术要求》团体标准立项申报项目的立项论证会议。听取了与会专
家的意见与建议,修改完善立项申报书。
2023年12月立项申报通过,标准起草组开始正式起早《构建文献资源知识
图谱技术要求》团体标准,2024年03月,标准起草组完成了标准草案的初稿。
2024年04月开始在起草组评审委员会内进行评审。共经历了1次组内评审,
期间收到了9条意见。起草组根据评审意见讨论修改后,形成内部征求意见稿,
4月18日送交中国计算机用户协会标准化工作委员会审核。
2024年05月根据预审专家评审意见对《构建文献资源知识图谱技术要求》
团体标准征求意见稿进行了修改,5月29日再次送交中国计算机用户协会标准
化工作委员会审核。
2024年06月根据计算机用户协会标委会反馈意见对《构建文献资源知识图
谱技术要求》团体标准征求意见稿进行了修改,6月18日送交中国计算机用户
协会标准化工作委员会审核。
四、编制原则
标准的用语、格式按照GB/T1.1-2020给出的规则起草。
标准内容的编制坚持以下原则:
1、科学性原则
2、规范性原则
3、实用性原则
4、前瞻性原则
5、持续改进原则
6、符合知识图谱行业发展需求
7、符合实际应用需求
五、标准主要内容
本标准规定了文献资源领域的知识图谱构建要求。
本标准适用于对文献资源知识图谱构建过程的全流程管理。
六、有关技术的说明
有关本标准起草过程中的一些技术问题说明如下:
1、数据接入与清洗
数据接入与清洗是在选择明确的文本数据源基础上,通过数据清洗和其他预
处理方法,消除数据中的噪声和异常值,进一步提高数据的质量和一致性。
2、数据整合和处理
数据整合与管理包括数据格式转换、数据归一化和数据集成等。首先将不同
来源的数据统一为构建知识图谱所需的格式。其次,数据归一化确保数据中的实
体和属性具有统一的表示,消除歧义。最后,数据集成将处理后的数据融合为一
个整体,为后续的知识图谱构建和分析提供坚实的数据基础。
3、知识模型构建
知识模型构建可建立知识图谱的概念模型,即采用什么样的方式来表达知识,
构建一个概念模型对知识进行描述。知识模型构建的过程是知识图谱构建的基础,
高质量的知识模型能避免许多不必要、重复性的知识获取工作,有效提高知识图
谱构建的效率。
4、知识抽取
知识抽取依赖于文献资源中的信息,借助自然语言处理等技术进行实体识别
和关系抽取。实体抽取旨在从文本中识别并提取出具有实际意义的实
您可能关注的文档
- 《构建文献资源知识图谱 服务能力要求》编制说明.pdf
- 《构建文献资源知识图谱 技术要求》.pdf
- DBJ50T343-2019装配式混凝土城市地下综合管廊结构技术标准.pdf
- JTG-D82-2009公路交通标志和标线设置规范.pdf
- 纸牌屋英文台词第三季第二集.docx
- 纸牌屋英文台词第二季第十二集.docx
- 纸牌屋英文台词第三季第三集.docx
- QXT37-2020气象台站历史沿革数据文件格式.pdf
- DBJ50T340-2019建筑中水工程技术标准.pdf
- GMT0068-2019 开放的第三方资源授权协议框架.pdf
- 分布式光伏经济评价规范.pdf
- DLT860.6-变电站通信网络和系统 第6部分:与智能电子设备有关的变电站内通信配置描述语言.pdf
- DBJ50-164-2013 民用建筑电线电缆防火设计规范.pdf
- DBJT29-218-2018装配式预制外墙板节点构造图示.pdf
- DB11-367-2006地下室防水施工技术规程.pdf
- DB31T1233-2020 植物铭牌设置规范.pdf
- NYT2263-2012 县级文化馆总分馆制管理服务规范.pdf
- NBT10247-2019 煤岩动力灾害远程监测平台通用技术要求.pdf
- GDJTGT-B01-2017 广东省公路工程机制砂水泥混凝土应用技术指南.pdf
- NBT10196-2019 架空导线单位产品能源消耗限额.pdf
文档评论(0)