- 1、本文档共44页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第二章 数字声音及MIDI 信息:数、文、形、音、图 音频:麦克风、扬声器 多媒体计算机: 声音的输入、存储、处理、输出 声音:消息、意向、情感 2.1 声音与听觉 声音:通过空气传播的一种连续的波,又称声波。 声音的度量:频率与幅度(声波压力的大小) 频率用音高表示,幅度用声强表示 与看得见的水波类似 波形声音 波形声音,实际上包含了所有的声音形式。任何声音信号,包括麦克风、磁带录音、无线电和电视广播、光盘等各种声源所产生的声音,都要首先对其进行模数转换,然后再恢复出来。 语音(speech) 人的声音不仅是一种波形,而且还有内在的语言、语音学的内涵,可以利用特殊的方法进行抽取,通常将语音也作为一种媒体。 音乐 音乐是符号化了的声音。这种符号就是乐曲,乐谱是转化为符号媒体的声音。电子乐器数字接口(musical instrument digital interface, MIDI )是十分规范的一种形式。 带宽与听觉 Hertz,Amplitude, Frequencyinfra-sound, ultrasound, hypersound 感知声音的幅度:用dyne(达因)/平方厘米表示,常转换成0—120dB(decibel),但对不同的频率,同样的声强,感觉不同。 声音信号: 有许多不同频率的信号组成,又称复合信号。 带宽:组成复合信号的频率范围。 纯音:单一频率的声音。 模拟声音信号:可分解成一系列正弦波的线性叠加。 最低频的音波称为基音,频率为基频 其余的为泛音,频率是基频的整数倍。 声音三要素:音高、音色、音强 音高:由基频决定,基频取对数后与人的音高感觉成线性关系。 音色:有混入基音中的泛音决定。 音强:幅度,听觉与声音信号强度不成线性关系,因而用20log幅度(分贝)表示 2.2 声音信号数字化 从模拟信号到数字信号 模拟信号:在时间与幅度上都连续,连续 记为x(t). 离散信号:按一定的时间间隔T,得到的x(nT). T为抽样周期,1/T抽样频率 量化:把抽样序列x(nT)量化成一个有限个幅度之的集合x’(nT). 采样频率 采样频率是指一秒钟时间内采样的次数。 在计算机多媒体音频处理中,采样频率通常采用三种:11.025KHz(语音效果)、22.05KHz(音乐效果)、44.1KHz(高保真效果)。常见的CD唱盘的采样频率即为44.1KHz。 量化位数 量化位数也称“量化精度”,是描述每个采样点样值的二进制位数。 例如,8位量化位数表示每个采样值可以用28即256个不同的量化值之一来表示,而16位量化位数表示每个采样值可以用216即65536个不同的量化值之一来表示。常用的量化位数为8位、12位、16位。 声道数 声音通道的个数称为声道数,是指一次采样所记录产生的声音波形个数。 记录声音时,如果每次生成一个声波数据,称为单声道;每次生成两个声波数据,称为双声道(立体声)。随着声道数的增加,所占用的存储容量也成倍增加。 2. 声音数字化: Sampling, Quantization, Coding 采样频率与量化精度 3.采样频率 奈奎斯特(Nyquist)定理(1928年提出原理,仙侬(Shannon)形成定理并应用,1933年卡切尼科夫用公式表述): 采样频率?2f 这里f为被采样信号的最高频率。 4. 量化精度 量化: 取样值(-?,+?)?有限个数(量化值近似) 若量化值有J个,若用二进制表示,需要R=log2(J) 位 量化误差:用有限的离散值表示无限多的连续值,必然存在误差. 该误差又称为量化噪声(与一般的噪声不同)。 采样精度可以用信噪比表示: R为编码位数 5. 音频数据率 未经压缩的数字音频数据率(bit/s)= 采样频率(Hz)×量化位数 (bit)×声道数 音频数据存储量(Byte)= 数据率(bit/s)×持续时间(s) / 8 例:采样率11.025KHz、量化位8位,采集1分钟, 则:音频数据率=11.025(KHz)×8(bit) = 88.2 (Kbit/s) 音频数据量=11.025(KHz)×8(bit) ×60(s)/8= 0.66 (MByte) 声音的质量与数据率 根据声音的频带,把声音的质量分为5个等级 2.3 声音文件的存储格式 声音文件的格式: PC机:.wav Apple: .aiff, .snd Unix: .au 2. 波形文件格式:1991年IBM与微软开发(以 .wav为扩展名) Fig
文档评论(0)