基于VQ-GMM 的音频分类 - 信息工程大学学报.PDF

基于VQ-GMM 的音频分类 - 信息工程大学学报.PDF

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于VQ-GMM 的音频分类 - 信息工程大学学报

Vo l. 9 No.4 信息工程大学学报 第 9 卷第 4 期 2008 年 12 月 Journal of Information Engineering University Dec.2008 基于 VQ-GMM 的音频分类 张瑞杰,李粥程,张连海,屈 丹 (信息工程大学信息工程学院,河南郑州 450002) 摘要:音频分类在基于内容的音频、视频检索和分析中起着重要作用。文章针对静音、语音、音 乐和环境背景音 4 类音频提出基于 VQ-GMM 的分类算法。首先通过闵值判决区分静音和非 静音,然后利用 VQ-GMM 分类器将非静音进而分为语音、音乐和环境背景音。实验结果表明 该方法的分类性能良好,平均正确率可达959毛 o 关键词:音频分类;VQ-GMM; 阀值判决 中图分类号:TP391 文献标识码:A 文章编号:1671 -0673(2008)04 -0423 -04 Audio Classification Based on VQ-G岛1M ZHANG Rui-jie , LI Bi-cheng , ZHANG Lian-hai , QU Dan (Institute of Info口nation Engineering , Information Engineeri吨 University , Zhengzhou 450002 , China) Abstract: Audio classification plays an important role in audio/video retrieval and analysis. This pa- per presents a classification algorithm based on VQ-GMM to classify audio into silence , speech , mu- sic and background. Firstly silence and non-silence are classified based on threshold judging and then VQ-GMM is used to further classify non-silence into speech , music and background. Experi- mental results show that the proposed algorithm produces satisfactory results and the average accura- cy reaches 95% . Key words: audio classification; VQ-GMM; threshold judging 音频分类是将音频数据按照感知特征或表述 分类,他采用的分类窗长是 2. 4s ; Scheirer[町等引入 内容的不同分为不同的类别,它是提取音频结构和 了频谱流量等 13 种特征用于音频分类,并且用多 内容语义的重要手段[1 , 2] 音频分类对基于内容的 种分类器(如 GMM、 BP-ANN 和 KNN) 做了实验,它 采用的分类窗长也是 2.4s Zhang 和 KUO[6] 利用 视频分割、语音检索和音频监管也可起到重要

文档评论(0)

youbika + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档