网站大量收购闲置独家精品文档,联系QQ:2885784924

多媒体第二章.ppt

  1. 1、本文档共10页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第二章 多媒体数据压缩技术 数字音频编码 数字图像编码数字视频编码常用的数据压缩技术 多媒体数据转换 2.1 数字音频编码 音频的基本特性 声音是由振动的声波所组成,在任一时刻t,声波可分解为一系列正弦波线性叠加: f(t)= ΣAnsin(nωt+φn)其中, ω称为基频或基音,它决定声音的高低;nω称为ω的n次谐波分量或称为泛音,与声音的音色有关; An是振幅,表示声音的强弱;φn是n次谐波的初相位。 音频数字化 波形音频是以数字方式表示音波。它是用声卡(包含ADC和DAC)来录制与执行播出声音的。计算机对声音表示主要通过采样产生一系列声音数据。事实上, 声波按频率可分为4类, 其中多媒体系统仅处理人类的听力所接受的频率范围的声音,我们称之为音频, 这个频率范围的音波称之为声音信号。 声音的频率分类声音分类频率范围亚声波0~20Hz人类的听力所接受的频率20Hz~20kHz超声波20kHz~1GHz超高声波1GHz~10THz 通过规则时间间隔测出音波振动幅度从而产生一系列声音数据。这种测出数据方法称之为采样,一秒内采样次数叫采样率。采样的离散音频数据要转换成计算机能够表示的数据范围,这个过程称之为量化 。量化后数字音频存储量计算公式 音频数据存储量(字节)=采样率(Hz)×量化位数(位)×声道数×音频长度(秒)/8 例2.1 激光数字唱盘CD-DA的标准采样频率为44.1Hz,量化位数为16位,立体声,这即CD音质。考虑一下CD-DA播放一分钟音乐所需要的存储量是多少? MIDI 音频 1980年制定一项工业标准,目的是让音乐及合成音可以经由一串消息在不同的设备上交流传输。MIDI提供了计算机外部的电子乐器与计算机内部之间的连接器接口。这种连接接口定义物理连接与电子乐器沟通的协议。MIDI也定义音频的形态与存储的方法。MIDI音频是以消息的方式而非波形的方式组成。MIDI有三种连接器(In、Out、Thru)。 In为输入, Out为输出,而Thru是用来扩充MIDI与其它设备连接用的。 音序器可以将音乐等声音以一种序列来储存。所谓序列便是一连串的音符加上系统事件的命令。 MIDI适配器是用来改变频道、路径与按键的。当电子琴的键盘与一般的MIDI规格不一致时可以经由适配器来修正使两者一致。 MIDI音频文件 MIDI音频文件是一串时序命令,它记录音乐的行为。 命令消息分为频道消息(频道声音消息、频道模式消息)和系统消息(系统实时消息、系统通用消息与系统专用消息)。它是以某种乐器的发声为其数据记录的基础。它的文件占用很少存储器空间,且可以做细部的修改,如修改节拍等。其声音效果不会因改变节拍而变调。MIDI不适合编制口语旁白的音频。 波形音频可从麦克风、录音带、CD、电视及其它来源获取。它把声音转换成储存体中数字信息。波形音频较为稳定,容易保持一致性,音频品质也较易获得保证。缺点是记录非常详尽,数据量极大,文件较MIDI音频大出200倍以上。要修改数字音频细节非常困难,大大地增加了CPU的负担。它可以适合任何一种音响,包括人的口语在内,故大多数节目仍采用这种音频。 3D音频三维环绕立体声能产生更加逼真的音频效果,是用户在用计算机时能感觉声音来自不同的方向。人耳的基本声音定位原理是两侧声音强度差别和两侧声音时间延迟差别。耳廓的作用是滤波器,根据声音的不同角度,加强、减弱音波能量,过滤后传给大脑,让人准确的定位声源。 3D音频3D音效的两个因素是定位和交互。定位即让人们准确的判断出声音的来源,可以通过事先录制,在进行特定的解码来实现。交互就是实时的定位,可以根据用户的控制来决定声音的位置。即时交互的声音对设备的要求比预先录制音轨的放音设备更高一些。 3D音频3D音效可分为以下几类:(1)扩展式立体声。 (2)环绕立体声。 (3)交互式3D音效。3D音效的控制是通过软件来实现的,称为应用程序接口(API)。 3D音频支持3D音频API种类:DirectX DirectSound 3D; Aureal 3D; EAX; Sensaura; Qsound; 杜比AC-3; 数字化影院系统DTS 2.2 数字图像编码 2.2.1 色彩的基本概念色彩的基本概念:色调,饱和度,亮度。色调是指某种颜色的性质和特点,是由物体表面反射的光线中什么波长占优势决定的。色调和光波的波长相关,而亮度和饱和度与光波的幅度相关。P18图。主要采用数字化方式对声音、文字等处理。 2.2.1 色彩的基本概念例如:在彩色电视信号表示时,设代表光强、色彩和色饱和度的YIQ彩色空间中各分量的带宽分别为4.2MHZ、1.5MHZ、0.5MHZ。再设各分量均被数字化为8b。从而一秒钟电视信号的数据量:(4.2

文档评论(0)

panguoxiang + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档