DB23_T 3857—2024人工智能数据标注总体框架规范.docxVIP

DB23_T 3857—2024人工智能数据标注总体框架规范.docx

  1. 1、本文档共9页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

ICS01.140.20CCS

ICS

01.140.20

CCS

L70

黑 龙 江 省 地 方 标 准

DB23/T3857—2024

人工智能数据标注总体框架规范

2024

2024-08-30发布

2024-09-29实施

黑龙江省市场监督管理局

发布

前 言

本文件按照GB/T1.1—2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规定起草。

请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别这些专利的责任。本文件由中共黑龙江省委网络安全和信息化委员会办公室提出并归口。

本文件起草单位:黑龙江省网络空间研究中心

本文件主要起草人:白瑞、呼大永、方舟、曲家兴、杨霄璇、宋雪、李锐、李晗、徐雪吟、刘颖、孟鸽、孙腾

人工智能数据标注总体框架规范

范围

本文件规定了人工智能数据标注的要求、总体框架、任务规划、任务实施、任务评审、交付验收、总结和后期维护。

本文件适用于面向人工智能学习、研发或应用等需要实施数据标注的行政主管部门、高校、科研院所和企事业单位,其他行业和机构可参照执行。

规范性引用文件

下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,仅该日期对应的版本适用于本文件;不注日期的引用文件,其必威体育精装版版本(包括所有的修改单)适用于本文件。

GB/T35295信息技术大数据术语GB/T25069信息安全技术术语

术语和定义

下列术语和定义适用于本文件。

下列术语和定义适用于本文件。

数据标注

对准备使用人工智能研究的文本、图像、音频和视频等数据进行特征标注以满足正常可用的过程。

数据标签

用于标识出数据特征并建立标注数据与人工智能可用数据之间联系的信息。

数据标注工具

能够进行数据标注及在数据标注过程中进行管理、控制等过程中发挥作用软件的统称。

数据标注技术

对数据进行转写、切割、提取、选择、富集标注、点标注、线标注、框标注、区域标注等操作的技术。

数据标注合格率

标注任务中,符合标注规则要求的已标注数据总量与所有已标注数据总量的比值。

4基本要求

标注人员

参与数据标注的人员应具备相应的资质,对确定符合要求的人员培训,应做到:

根据标注任务说明,对标注人员进行岗前能力培训。培训合格者,参与标注任务;

建立标注人员能力档案,记录标注人员承担标注任务的相关内容,用于进行标注人员能力评估与标注质量追踪。

明确职责

应规定参与人工智能数据标注的所有角色的职能,并做到:

设立人工智能数据管理岗位。该岗位要求对业务、法律法规比较熟悉,能够根据业务实际需要确定承担数据管理工作的部门或人员;

明确各环节角色的职责。应明确数据标注人员、数据标注培训人员、数据标注质量控制人员以及与人工智能数据标注相关的其他角色的职责。

合法合规

应出台规章制度保障人工智能数据标注任务的合法合规性,并做到:

学习并严格执行与数据保护、数据安全相关的法律法规、制度等;

正确对个人隐私和敏感数据进行处理,确保标注过程合法合规;

建立跨部门、跨组织数据标注、传输的保护制度。

保障质量

应确保人工智能数据标注的质量,并做到:

确保人工智能数据标注的准确性、可用性、完整性;

建立质量保障制度,提高数据标注合格率;

建立定期抽查,不定期检测的质量控制制度。

标注范围最小化

应确保数据标注相关角色对数据掌握范围的最小化,并做到:

数据标注任务开始前,明确数据接触范围及使用范围;

提供技术或建立制度保证数据标注过程中,数据范围不扩散;

数据标注任务完成后,及时回收数据操作权限。

数据安全

应从以下几方面做好数据必威体育官网网址,确保数据安全:

数据分发,使用必要的安全方式确保人工智能数据分发过程的安全性要求;

数据存储,建立访问控制制度和加密机制确保人工智能数据存储必威体育官网网址性要求;

加密数据的标注,使用加密算法对加密人工智能数据进行运算标注,如同态加密算法等;

数据汇总,使用数据隔离等方式确保人工智能数据汇总时满足必威体育官网网址性要求;

密码密钥的安全,建立人工智能数据密码密钥管理系统。

数据完整

为确保标注过程数据完整性,应做到:

接收人工智能数据可验证,保证接收的数据已通过认证;

人工智能数据传输过程完整性,保证标注活动数据完整性;

数据标注可靠性,确保标注过程只执行批准的范围;

数据储存完整性,确保数据标注存储及备份完整性。

数据可审计

应对数据标注各环节建立审计机制或制度,确保数据标注全过程可审计,并做到:

对数据标注过程信息记录,并保证记录过程真实可靠;

利用合理的技术方案确保数据标注的所有过程和行为可溯源。

其他要求

数据标注除了考虑以上要求外,还应针对人工智能

您可能关注的文档

文档评论(0)

187****6937 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档