- 1、本文档共24页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
PAGE
PAGE27
授课周次
第周
授课时间
2024年月日至2024年月日
课程章节
第5章机器人感知智能
5.1机器人听觉概述
5.1.1人类听觉模型
5.1.2机器人听觉感知
教学目的
1、掌握声音的定义与分类;
2、掌握人类听觉工作方式;
3、了解听觉感知的应用。
内容提要及板书设计
第5章机器人感知智能
5.1机器人听觉概述
5.1.1人类听觉模型
5.1.2机器人听觉感知
重点、难点及解决方案
重点:声音的定义与分类
难点:人类听觉工作方式
教学内容时间分配
序号
教学内容
学时分配
1
人类听觉模型
30
2
机器人听觉感知——人类听觉工作方式
30
3
机器人听觉感知——听觉感知应用
30
4
5
教学手段
讲解
教学形式
(在右栏勾选)
理实一体()理论教学(?)
实验()实训()上机()
作业
作业完成方式
书面()电子()
教学后记
注:教案按周次填写,课堂组织和教学过程设计填写在附页中。
附页:第周
序号
具体内容(课堂组织和教学过程设计)
授课改进意见及实时教学效果记录
第5章机器人感知智能
5.1.1人类听觉模型
一、声音的定义
声音是一种物理波动现象,即声源振动或气动发声所产生的声波。
声波通过空气、固体、液体等介质传播,便能被人或动物的听觉器官所感知。
声波具有一般波的各种特性,包括反射、折射和衍射等。
声音还是一种心理感受,不仅与人的生理构造和声音的物理性质有关,还受到环境和背景的影响。
图5.1声音的分类关系图
从信号的角度——声音可分为纯音、复合音和噪声。
纯音和复合音都是周期性声音,波形具有一定的重复性,具有明显的音高。
纯音是只具有单一频率的正弦波,通常只能由音叉、电子器件或合成器产生,在自然环境下一般不会发生。
日常生活和自然界中听到的声音大多是复合音,由许多参数不同的正弦波分量叠加而成。
纯音和复合音之间可以互相合成与分解。
从声音特性的角度——声音可划分为语音、音乐和一般音频。
语音信号属于复合音,其基本要素是音高、强度、音长、音色等。
音乐是人类创造的复杂的艺术形式,组成成分是上述的各种乐音,包括歌声、各种管弦和弹拨类乐器发出的复合音、少量来自环境声的复合音以及一些来自打击乐器的噪乐音。
除了人类创造的语音和音乐,在自然界和日常生活中,还存在着其他数量巨大、种类繁多的声音,统称为一般音频或环境声。
二、人类听觉中枢
外耳包括耳翼和外耳道两个部分。从外耳道发出的声音在中频区域与外耳产生共鸣。外耳道的最后部分是一种称为鼓膜的薄膜。
中耳包括鼓膜和内耳层,内层有三个听小骨,即锥骨、砧骨和镫骨,它们彼此相连。声波经外耳道进入后,会引起鼓膜的震动,三个与鼓膜连接的听骨会因为声音的震动而产生震动。
内耳是人类听觉的一个主要器官,在内耳有一个重要的螺旋状环形通路,称为耳蜗。耳蜗是主要的听觉器官,它是由骨头组成,外形像蜗牛,里面充满了高电阻的淋巴。
图5.2听觉信息处理涉及的学科关系
当声音传入耳内时,由外耳、中耳、内耳分别负责,共同发出“感觉”讯息给大脑。一般而言,声源与媒介间的时序差异和声源间的强度差异,可以帮助人们精确地确定声源的方位。
三、人类听觉中枢的工作方式
外耳鼓膜接收外界声音,鼓膜产生震动,中耳将这种震动放大、压缩和限幅,并抑制噪声。
内耳的主要功能是对不同声音进行分析。纤维将基底膜接受声音时产生的震动变成电信号的平均值时,对应的继电器接通。
位于耳蜗底部的基底膜使得耳蜗带有相异的电谐振以及机械谐振效应,如果接收到的声音信号中含有不同频率段,那么在基底膜的不同位置会产生由于行波差异导致的某个频率段的最大峰值。
重合神经元主要负责完成突触和细胞体的响应,在整个听觉中枢系统中完成对语音信号的空间方位信息提取与整合。
机器人听觉传感器的总体思想:模仿人的听觉中枢,完成语音信号的信息提取和声源定位。
听觉感知应用
(一)声源目标的实时定位:在许多应用场景下机器人是需要实时与人进行沟通的,目标定位的实时性是机器人定位应用的关键问题,如何进一步提高算法的精度和速度是下一步研究的主要内容之一。
(二)多语音识别:很多时候机器人实际工作环境不可能是单声源的,如何在多声源情况下服务机器人准确辨识、分离、判断任务,是人机互动的前提之一。
(三)针对运动声源实现跟踪定位:机器人大多需要不停移动或者被服务对象是运动的,如何针对运动的声源进行定位、追踪,同样是服务机器人进行声源定位的研究内容之一。
(四)智能、友好的交互方式:机器人可以透明地、主动与人交互,而人
文档评论(0)