基于隐马尔可夫模型的音频检索-应用数学专业论文.docxVIP

基于隐马尔可夫模型的音频检索-应用数学专业论文.docx

  1. 1、本文档共45页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
硕士论文 硕士论文 桀于隐马尔可犬模型的音频检索 ABSTRACT As one component in multimedia,audio SignalS are filled in the world, which greatly enricb our semantiC appet ception and acquiSi Lion in i nformation society.flowever,the current way to get information iS mainly based on the vision,especiallY the text.The retrieval based on the audio information iS ignored.So,an audi0 retrieval system iS presented in thi S paper.Depending on time—domain and frequency—domain features: short—time energy. short time zero crossing rate. short.-tjfile energy—frequency value and mel—coeffients,audi0 streams are segmented into Six classes:commercial, anchorperson,weather forecast, footba]l match,musiC and drama.Then,an audi0 retrieval system based on tlMM and BP neural network iS presented Since HMM can Simulate stochastiC time series data quite well and ANN has many advantages such as parallel processing ability,powerful discriminating ability etc.Based on gradient descent,traditional BP algorithm has a slow operating speed, SO an improved BP algorithm is presented in this paper to improve the recognition speed.Experimental results showed its validity, Key Words:audio retrieval,hidden Markov models,neural network,improved BP arithmetic 硕士论文 硕士论文 桀于隐马尔可犬模型的音频检索 1 绪论 1.1前言 计算机出现之前,人们是通过纸和笔来记录文字和数据的,这些数据是以静念形 式固定下来的,所以很难奁询和修改。计算机出现后,有了功能强大的有关数据组织 和构造的技术,即数据结构技术,从而提供了大量的处理字符和数字信息的能力。但 是人类并不仅仅依靠字符和数字这种单一的形式来传递和接收信息,而是通过多种感 官来接收外界信息的。随着计算机技术、通信网络和多媒体技术的发展,多媒体信息 已经成为信息系统的主要数据来源形式。事实上,在许多的信息系统中都存在大量的 多媒体数据,如图片资料、数字视频、数字声音和音乐、动画、地图、录音资料等。 这些数据不仅种类多,而且数据量大,因此对多媒体信息进行有效的管理和使用,已 成为迫切需要加以解决的重要问题。 传统的数据管理偏重于数据库管理系统本身的研究,包括数据库理论模型、查询 语言、调度与处理算法等,其目的是在操作系统之上向用户提供一个健壮的、提供数 据独立性的数据管理工具。随着多媒体数据的引入,信息系统及其应用超出了传统的 联机事务处理范围,而向着高级复杂的多媒体数据管理的应用领域深入和发展。多媒 体内容及其管理被认为是信息化社会的一个重要元素。信息化社会的三个要素是计算 机、通信网络和信息内容。可见,信息内容的描述、管理和操纵是其中一个非常重要 的研究方向,而多媒体的内容管理是一种新的挑战。 为了实现对多媒体信息的检索,最早的方法是用人工输入多媒体数据的各种属 性,建立多媒体的属性库来支持对多媒体数据的查询。但人工注释需要大量的人力, 不适应实时的信息处理。基于内容的方法从新的角度来管理多媒体信息,基于内容的 检索(Content--Based Retrieval,CBR)就是从多媒体数据中提取出特定的信息线索, 然后根

文档评论(0)

1234554321 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档