数字媒体技术导论(微课版)-教案 03 数字音频技术.doc

数字媒体技术导论(微课版)-教案 03 数字音频技术.doc

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

第3章

任课教师

专业

日期

年月日

教学课题

数字音频技术

课时

6课时

所选教材

《数字媒体技术导论》

教学班级

一、教学目标

1.学习目标

(1)了解声音、音频的概念,及它们的基本属性;

(2)熟悉音频数字化的过程、数字音频技术指标、数字音频的数据量和常用文件格式;

(3)掌握使用Audition处理音频的方法;

(4)了解语音合成与识别技术的概念、实现原理、方法及应用。

2.素养目标

(1)培养勤奋好学、吃苦耐劳的传统优良精神;

(2)学会了解、分析数字媒体技术行业的发展前景,把握住新的机遇。

二、教学重难点

1.教学重点

(1)音频的概念与分类;

(2)数字音频的文件格式;

(3)语音合成

(4)语音识别;

(5)Audition的基本操作。

2.教学难点

(1)语音合成;

(2)语音识别;

(3)Audition的基本操作。

三、教学方法

(1)讲授与互动:结合理论讲解和实例分析,引导学生参与讨论和思考。

(2)案例分析:提供数字媒体技术的相关案例,让学生分析其应用和影响。

(3)小组讨论:组织小组讨论,让学生分享对数字媒体技术的看法和体验。

(4)多媒体展示:利用多媒体技术展示数字媒体的实际应用和发展趋势。

四、教学资源

教材、多媒体资料、在线网站、行业案例、社交媒体等。

五、教学过程

教学内容

互动设计

一、理论讲解(4课时)

1.数字音频基础知识

(1)声音的概念与特点

声音的概念:声音是由物体振动产生的声波(即声音信号),能通过介质(空气、固体或液体)传播并能被人或动物听觉器官所感知的波动现象。

声音的基本特征:声音具有3个基本特征,分别为音调、音强、音色,也常称为声音的三要素。

声音的传播特征:声音由声源振动产生,声音的传播和声源振动发声的原理一样。声源是一个振动源,它使周围的介质产生振动,并以波的形式向四面八方传播。

声音的频率特征:不同的声音有不同的频率范围。人耳只能听到频率在20Hz~20kHz之间的声音,听不到低于20Hz和高于20kHz的声音。

(2)音频的概念与分类

音频是指人耳能够听到频率范围在20Hz~20kHz的声音,即人类能够听到的所有声音都称为音频,包括噪音。根据音频的属性不同,可将其分为模拟音频和数字音频。

2.音频数字化

(1)音频数字化的过程

音频数字化的过程主要涉及对模拟信号的采样、量化和编码等基本环节。

采样是将模拟音频信号在时间上进行离散化处理,即每隔相等的一段时间在模拟音频信号波形曲线上采集一个信号样本。

对信号进行量化操作即是对采样后的信号,其振幅值的数目加以限定,进行离散化处理,量化后的信号称为离散幅度信号。

编码一方面是将采样和量化后的数字化音频信号以二进制形式并按照一定的数据格式表示,另一方面是采用一定的算法压缩数字数据以减少信号的存储空间和提高传输效率。

(2)数字音频技术指标

数字音频的技术指标主要有采样频率、量化位数和声道数。

采样频率越高,则经过离散数字化的声波就越接近原始的音频波形,也就意味着音频的保真度越高,音质也越好,数据量也越大。

量化位数的大小决定了音频的动态范围,即最高音频与最低音频之间的差值。量化位数越高,音质越好,数据量也越大。

从单声道(只有一个音频)到双声道(又称立体声,有两个音频)再到多声道,声音的质量越来越好,但同时也增加了对存储空间和传输媒体设备的要求。

(3)数字音频的数据量

数字音频的数据量,是指在磁盘上存储未经压缩数字音频信号所需的字节数,即存储该数字音频文件所需的容量,采样频率和量化位数是影响数据量的两个关键因素。

(4)数字音频的文件格式

无压缩音频:不经过压缩的音频,其优点是易于生成与编辑(采样量化后的信号直接转换成二进制数据进行存储),但缺点是在保证音质的前提下,文件占用的存储空间较大。常见的无压缩音频格式有WAV和AIFF两种。

有损压缩:是指压缩中删除部分音频信号(即损坏性的压缩),从而降低音频文件所需存储空间,方便存储和传输,但音质次于无压缩的音频文件。常见的有损压缩音频格式有MP3、WMA、AAC、OGG4种。

无损压缩音频格式:可以在完全保存源文件数据的基础上,将音频文件的体积压缩得更小,同时能够无损还原压缩的音频文件,既能保证音频质量又降低了文件的存储量。常见的无损压缩音频格式有APE和FLAC两种。

3.语音合成与识别

(1)语音合成

语音合成又称文语转换,它是将计算机自己产生的或外部输入的文字信息转变为拟人化的、高自然度的语音输出技术。语音合成随着计算机技术和数字信号处理技术的发展而兴起,同时涉及声学、语言学等多个学科技术。

(2)语音识别

语音识别是将语音信号转化为可理解文本形式的技术,它通过分析和处理输入的语音信号,将其转化为对应的文本输出,目的是为了

文档评论(0)

xiaobao + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档