音频信息的获取与处理.pptVIP

下载本文档

0
0
约1.83万字
约 10页
2025-03-22 发布于北京
举报
版权申诉

音频信息的获取与处理.ppt

1、本文档共10页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

语音识别将语音识别为计算机能理解的文字或命令02文语转换就是把计算机内的文本转换成声音014、文语转换和语音识别音频卡的分类主要是根据采样量化的位数来分类的。通常分为8位，16位，32位等。位数越高，量化精度越高，音质越好。同时形成声音文件所需的容量越大。计算声音文件公式如下：S=DxRx（r/8）x声道数D代表采样频率，R代表采样时间以秒计算，r代表量化位010302（二）音频卡的分类(1)（二）、音频卡的分类(2)独立音频卡，插在主板的ISA或PCI槽中。主板集成。目前市场上90%以上的主板都集成AC‘97声卡。现在广泛在整合主板上集成的板载声卡采用的音效芯片:创新ES1370/CT5880、C-Media8738、YAMAHAYMF744、傲锐AU8820，一些独立声卡采用的芯片和上面的完全一样。现在已经出现了6声道的板载声卡，板载5.1输出也变为现实。USB声卡。普通的性能，过大的体型，还有居高不下的价格，但也有一些产品的价格较低。010302音频卡的特性强劲的音频处理引擎环境音效增加现有音频的内容SoundBlasterTMPCI标准多音箱输出256复音音乐合成器环境音效功能扩展集/广泛的软件支持音频卡的工作原理声音的合成与处理：数字音频处理器（DSP）、FM合成器以及MIDI控制器，其任务是完成声波信号的模/数（A/D）、数/模（D/A）转换，调频技术控制声音的音调、音色和幅度，FM音乐合成器具有多种复音操作的功能；01020304主要组成部分：混合信号处理器：内置数字/模拟混音器、混音器的声源可以是MIDI信号、CD音频、话筒和PC的扬声器等，可以选择不同音源进行混合录音；功率放大器：使输出的音频信号有足够的输出功率；计算机总线接口和控制器：ISA总线，PCI总线，总线接口和控制器有数据总线双向驱动器、总线接口控制逻辑、总线中断逻辑及DMA逻辑组成。（二）工作原理PC总线数据总线驱动器总线接口和控制器游戏接口MIDI接口混合信号处理器数字声音处理器MIC放大器功率放大器音乐合成器音乐合成器地址总线控制总线MIC扬声器CDline音频卡的工作原理图音频卡简称声卡，它将模拟音频进行模数转换送入计算机，进行处理后再经过数模转换，输出加工后的合成音频。DSP：它完成8位或16位单声道/立体声数字声音的记录和播放；完成4：1，3：1和2：1的ADPCM压缩/解压缩，控制取样频率，翻译与声卡兼容的MIDI指令，提供扬声器控制，控制各种直接存取DMA方式。总线接口负责为总线和声卡各部分提供握手信号和数据传输。音频卡的工作原理衡量声卡质量的关键技术总线类型：ISA6Mbit/s，PCI133Mbit/s标准支持即插即用取样能力芯片类型：CODEC芯片合成器：FM和波表合成MIDI音乐音效音频编码基础和标准1、时域信息的冗余度（1）幅度的非均匀分布（2）样本间的相关（3）周期之间的相关（4）基音之间的相关浊音清音（5）静止系数（6）长时相关函数非均匀的长时功率谱密度语音特有的短时功率谱密度2、频域信息的冗余度01人的听觉具有掩蔽效应人耳对不同频段的声音的敏感程度不同，通常对低频端较之对高频段更敏感。人而对语音信号的相位变化不敏感。3、人的听觉感知机理02基于音频数据的统计特性进行编码，其典型的技术是波形编码。如PCM，DPCM，ADPCM。基于音频的声学参数，进行参数编码，可进一步降低数据率；参数有共振峰、线性预测系数、滤波器组等，如CELP、MPLPC。基于人的听觉特性进行编码，利用掩蔽效应，设计心理学模型，从而实现高效率的数字音频的压缩。如MPEG的高频编码和DolbyAC-3。音频编码的分类STEP1STEP2STEP3PCM：直接对语音信号进行模数转换。只要采样频率足够高，量化尾数足够多，就能使编码后恢复的语音信号有较高的质量。DPCM：即只传输语音预测值和样本值的差值，以此降低音频数据的编码率。ADPCM：它是DPCM方法的改进，通过调整量化步长，对不同数模设置不同的量化步长，使数据得到进一步的压缩。常用三种波形编码的方法：国际电报电话咨询委员会（CCITT）和国际标准化组织（ISO）先后提出了一系列有关音频编码的标准。具体如下：G.711G.721G.722G.728MPEG中的音频编码AC-3的编码和解码1234562.4.5音频编码标准音频编码的算法和标准算法名称数据率标准应用质量