一种基于倒排索引的音频检索方法An Inverted Index - 电子与信息学报.PDF

一种基于倒排索引的音频检索方法An Inverted Index - 电子与信息学报.PDF

  1. 1、本文档共7页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
一种基于倒排索引的音频检索方法An Inverted Index - 电子与信息学报

第34 卷第11 期 电 子 与 信 息 学 报 Vol.34No.11 2012 年11 月 Journal of Electronics Information Technology Nov. 2012 一种基于倒排索引的音频检索方法 张雪源* 贺前华 李艳雄 叶婉玲 (华南理工大学电子与信息学院 广州 510640) 摘 要:传统的基于实例的音频检索算法采用顺序索引,检索时需遍历数据库并导致难以忍受的等待时间。针对传 统的顺序的索引方法,该文提出基于倒排索引的音频检索算法。该方法首先利用多种音频特征构成的超向量,通过 多层音频分割方法将连续音频流分割为特征数值波动幅度小的短时音频段;然后利用事先训练好的音频字典,将短 时音频段序列转换为可以表征音频内容的音频字序列,并建立倒排索引;检索时,将用户提交的查询转换为音频字 后利用倒排索引无须遍历数据库即可直接定位候选段落,并根据候选段落与查询的内容相似度大小对候选段落进行 排序,将排好序的列表作为检索结果。仿真实验以匹配项排名、同类检索结果比例、定位准确性和检索用时4 个方 面作为评价指标,实验结果显示,该算法能够在平均1.101 s 时间内实现92.58%的检索准确率。 关键词:音频信号处理;音频检索;内容相似度;倒排索引 中图分类号:TN912.3 文献标识码: A 文章编号:1009-5896(2012)11-2561-07 DOI: 10.3724/SP.J.1146.2012.00510 An Inverted Index Based Audio Retrieval Method Zhang Xue-yuan He Qian-hua Li Yan-xiong Ye Wan-ling (School of Electronic and Information Engineering, South China University of Technology, Guangzhou 510640, China) Abstract: Traditional example based audio retrieval algorithms use forward index, with which, retrieval processing need to traverse the whole database, resulting in intolerable response time. This paper proposes an inverted-index based audio retrieval method. Through constructing super-vector comprising several audio features, audio stream is first segmented into short segments with small feature fluctuation; Based on a pre-trained audio word dictionary, short audio segment sequence is then transformed into audio word sequence, from which inverted index is constructed; During the retrieval phase, the query audio sample is transformed into audio words and retrieval is carried out, candidate segments are ranked according to the similarity with the query. Match term ranking, same

您可能关注的文档

文档评论(0)

youbika + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档