信息技术 三维声技术 编码、分发与呈现 编制说明.docx

信息技术 三维声技术 编码、分发与呈现 编制说明.docx

  1. 1、本文档共18页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

《信息技术三维声技术编码、分发与呈现》

(征求意见稿)编制说明

一、工作简况

(一)任务来源

根据国家标准化管理委员会2024年标准制修订计划的安排,由中国电子技术标准化研究院负责组织制定国家标准《信息技术三维声技术编码、分发与呈现》(计划项目代号为T-469)的制定任务。

(二)主要工作过程

该标准的制定工作起始于2021年,由世界超高清产业联盟联合中关村视听产业技术创新联盟共同制定自主三维声技术方案,2022年4月,世界超高清产业联盟发布了T/UWA009.1-2022《三维声音技术规范第1部分:编码分发和呈现》标准第一版;2023年,中关村视听产业技术创新联盟发布了T/AI109.3《信息技术智能媒体编码第3部分:音频》标准。两个联盟标准的差异在于T/AI109.3中包含了通用高码率编码工具和通用全码率编码工具两部分,而T/UWA009.1只包含通用全码率编码工具。T/UWA009.1-2022标准在产业实际应用落地中,对标准的技术内容提出了一些新的需求,因此为了更好适应产业应用需求,提出对T/UWA009.1-2022标准的修订计划,完善元数据编码工具、增加比特分配方案和低复杂度方案,于2023年发布T/UWA009.1-2023版。

2024年由中国电子技术标准化研究院牵头组织提交了国家标准立项工作,标准立项后成立标准起草组共同起草编制,旨在整合前期国内相关自主三维声技术标准,形成统一的三维声技术方案,为产业应用提供便利,促进我国三维声音产业形成良好生态。

(三)主要参加单位和制定人员及所做工作

征求意见稿主要起草单位:中国电子技术标准化研究院、清华大学、华为技术有限公司、北京理工大学、中关村视听产业技术创新联盟、国家广播电视总局广播电视规划院、中央广播电视总台、北京字跳网络技术有限公司、赛因芯微(北京)电子科技有限公司、腾讯科技(深圳)有限公司、全景声科技南京有限公司、小米通讯技术有限公司、北京大学、博华超高清创新中心、杭州当

虹科技股份有限公司、咪咕文化科技有限公司、中国移动集团有限公司、中国联合网络通信集团有限公司、中国电信集团有限公司、中移动(杭州)信息有限公司、联通视频科技有限公司

二、标准编制原则和确定主要内容的论据及解决的主要问题

(一)标准编制原则

在本标准制定过程中,标准制定工作组充分考虑到标准自身的科学性、合理性和易操作性,同时也为了使标准使用者易于理解标准内容,将满足对标准技术内容完整准确表达的前提下进行标准内容制定,力图达到语言表达形式尽可能简单、易懂,使相应专业人员便于理解和使用。

在编写内容与格式上GB/T1.1—2020《标准化工作导则第1部分:标准化文

件的结构和起草规则》要求进行编写。

在技术内容和指标方面,标准制定工作组在本标准编制过程中遵循以下原则:

一致性:要求本标准与系统、视频编码、终端等其他相关标准保持一致,为未来相关标准的制定提供支持;

前瞻性:要求本标准在公布实施后一定时间范围内,保持标准先进性和可用性,以适用于超高清视频产业发展需要;

引领性:要求支持高质量音频信号的编码表示方法和音频解码方法和渲染方法,为三维声音全流程中音频制作、元数据、渲染、控制、终端设备重放等关键环节提供指导,

准确性:要求本标准的规范和定义简练、准确,不引起歧义,能够支持支持单声道、双声道立体声、三维声床、对象、HOA音频编解码;

可操作性:要求本标准提供的编码工具在具体应用中可实现易操作。

(二)标准制定的目的和意义

长期以来,音频核心技术标准受制于国外企业和标准化组织,前期中国国内相关技术组织已开展了自主三维声标准的研制工作,因此亟需把握国内三维声音技术与国外相关标准竞争的机遇期,推进我国自主的三维声技术标准形成统一方案,为三维声音全流程中音频制作、元数据、渲染、控制、终端设备重放等关键环节提供指导,促进我国三维声音产业形成良好生态,助力我国三维声音标准朝“走出去”目标发展,进一步提升我国在三维声音标准化领域中的话语权,

(三)标准编制的主要内容和解决的主要问题

本文件规定了三维声音频技术的编码、分发与呈现方法。

本标准适用于广播流媒体、网络电视、数字电影、实时通信、虚拟现实和增强现实、视频监控、数字存储媒体等领域。

本文件的规范性技术内容包括:

1)位流语法规则

本文件规定了位流语法规则,给出了数据元素以标准类型出现时的语法结构描述。

2)三维声音频编码框架

本文件定义的三维声音频编码系统支持声道信号编码、对象信号编码、HOA信号编码、元数据编码、扬声器渲染和双耳渲染。

3)音频解码工具

本文件定义的音频解码包括核心解码和HOA空间解码,

文档评论(0)

fdfdsos + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:7100020006000001

1亿VIP精品文档

相关文档