- 1、本文档共3页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
一种基于小波和快速傅里叶变换的学习型歌唱系统
Computer Engineering and Applications 计算机工程与应用 2012 ,48 (3) 143
一种基于小波和快速傅里叶变换的学习型歌唱系统
潘伟洲,单志龙,邱景钦,袁世超,黄煜廉
PAN Weizhou, SHAN Zhilong, QIU Jingqin, YUAN Shichao, HUANG Yulian
华南师范大学 计算机学院,广州 510631
School of Computer, South China Normal University, Guangzhou 510631, China
PAN Weizhou, SHAN Zhilong, QIU Jingqin, et al. Intelligent singing system based on wavelets transform and fast Fourier trans-
form. Computer Engineering and Applications, 2012, 48 (3 ):143-145.
Abstract :Speech recognition and text to speech technologies enable computers to understand human languages and read as a human
respectively. In this paper, an intelligent singing system is proposed. The system uses percussion locating method to locate every mo-
ment when each word of lyric occurs. Daubechies Wavelets Transform (DWT )and Fast Fourier Transform (FFT )are used to calculate
the fundamental frequency. The computer sings the song with text to speech technology.
Key words :Melody Lyric to Song (MLTS ); singing; Daubechies Wavelets Transform(DWT ); Fast Fourier Transform(FFT ); text to speech
摘 要:语音识别和合成技术分别实现了计算机理解人类语言和模仿人类阅读文本的功能,提出了一种实现计算机学习并演唱
歌曲的系统。系统运用敲击定位法定位发音时刻,然后利用Daubechies 小波变换和快速傅里叶变换计算出对应的基频,采用语
音合成技术输出声音。
关键词:MLTS 技术;歌唱;Daubechies 小波变换;快速傅里叶变换;语音合成
DOI :10.3778/j.issn. 1002-8331.2012.03.042 文章编号:1002-8331(2012 )03-0143-03 文献标识码:A 中图分类号:TP393
1 引言 由于所有歌曲都是由各个不同频率的音阶和其延续时间
在计算机系统中,语音应用技术作为信息技术处理领域 的长短来实现的,所以电脑学唱一首歌的过程也可以像人一
的一项前沿技术,主要包括语音识别(Speech Recognition,SR) 样:计算机先“听”一首歌,然后“听”出哪个地方唱哪个字和发
[1] 哪个调,再“看”着歌词唱出来。“听”的过程就是一个分析的过
和语音合成(Text to Speech ,TTS )技术 。语音识别技术是指
计算机系统能够根据输入的语音识别出其代表的具体意义, 程,根据歌曲的信息和与之相匹配的文本歌词提取相关的音
进而完成相应的功能。通过语音识别技术,计算机可以“听” 乐信息特征值,而“唱”的过程实际上是一个根据分析得到的
懂人类的语言。而语音合成技术则是将计算机自己产生的或 特征值调用音库发声的过程,该过程如图2 所示。
外部输入的文字信息,按语音处理规则转换成语音信号输
出。通过语音合成技术,计算机具有了“说”的能力。语音合 wav 音频
您可能关注的文档
最近下载
- Unit 6 Understanding ideas Longji Rice Terraces 课件-高中英语外研版(2019)必修第一册.pptx VIP
- 护理学导论(高职)教学教案.docx
- 2024年部编新改版语文六年级上册全册月考试题含答案(共4套).docx
- 饮用水和环境卫生公众健康宣教及风险沟通答案-2024年全国疾控系统“大学习”活动.docx VIP
- 新型冠状病毒、甲型和乙型流感病毒全预混冻干多重荧光PCR检测试剂盒及其检测方法发明专利.pdf VIP
- 基金会捐赠协议.doc VIP
- XX市智慧安居工程(一期)报警求助综合受理指挥分系详细设计方案.doc VIP
- 《乡土中国》 第11篇 《长老统治》.ppt
- [知识]职业生涯人物访谈(教师).pdf VIP
- 第六单元整本书阅读《西游记》课件 2024—2025学年统编版语文七年级上册.pptx VIP
文档评论(0)