- 1、本文档共9页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
200_利用adaboost-svm集成算法和语块信息的韵律短语识别
文章编号:1003-0077 (2015)00-0000-00
利用AdaBoost-SVM 集成算法和语块信息的韵律短语识别
1,2 1
钱揖丽 ,冯志茹
(1. 山西大学 计算机与信息技术学院,山西 太原 030006 ;
2. 山西大学 计算智能与中文信息处理教育部重点实验室,山西 太原 030006)
摘要:该文提出一种基于汉语语块结构并利用AdaBoost-SVM 集成学习算法的汉语韵律短语识别方法。首
先,对语料进行自动分词、词性标注和初语块标注,然后利用基于结合紧密度获取的规则对初语块进行归
并,得到最终的语块结构。其次,基于语块结构并利用AdaBoost-SVM 集成算法,构建汉语韵律短语识别
模型。同时,该文利用多种算法分别构建了利用语块信息和不利用语块的多个模型,对比实验结果表明,
表示浅层句法信息的语块能够在韵律短语识别中做出积极有效的贡献;利用 AdaBoos-SVM 集成算法实现
的模型性能更佳。
关键词:汉语语块;AdaBoost-SVM;韵律短语;识别
中图分类号:TP391 文献标识码:A
Recognition of Chinese prosodic phrase based on AdaBoost-SVM
algorithm and chunk information
QIAN Yili1,2 , FENG Zhiru1
(1. School of Computer Information Technology, Shanxi University, Taiyuan, Shanxi 030006, China;
2. Key Laboratory of Computational Intelligence and Chinese Information Processing of Ministry of Education,
Shanxi University, Taiyuan, Shanxi 030006, China)
Abstract: A method for Chinese prosodic phrase recognition based on Chunk and AdaBoost-SVM algorithm is
proposed in this paper. Firstly, the initial chunks are marked on the corpus of automatic word segmentation and
part of speech tagging, and then they are merged using the rules based on the closeness between initial Chunks.
Secondly, based on the block structure and the AdaBoost-SVM integrated algorithm, a Chinese prosodic phrase
recognition model is constructed. Meanwhile this paper utilized various algorithms to build different models which
use or not use Chunk information, the comparative experimental results show that the shallow syntactic
information Chunk has made a positive and effective contribution to Chinese prosodic phrase recognition, and the
performance of the AdaBoost-SVM model is better.
Key words: Chinese chunk; AdaBoost-SVM; prosodic phrase; recognition
1 引言
语音合成是
您可能关注的文档
最近下载
- Unit 6 Understanding ideas Longji Rice Terraces 课件-高中英语外研版(2019)必修第一册.pptx VIP
- 护理学导论(高职)教学教案.docx
- 2024年部编新改版语文六年级上册全册月考试题含答案(共4套).docx
- 饮用水和环境卫生公众健康宣教及风险沟通答案-2024年全国疾控系统“大学习”活动.docx VIP
- 新型冠状病毒、甲型和乙型流感病毒全预混冻干多重荧光PCR检测试剂盒及其检测方法发明专利.pdf VIP
- 基金会捐赠协议.doc VIP
- XX市智慧安居工程(一期)报警求助综合受理指挥分系详细设计方案.doc VIP
- 《乡土中国》 第11篇 《长老统治》.ppt
- [知识]职业生涯人物访谈(教师).pdf VIP
- 第六单元整本书阅读《西游记》课件 2024—2025学年统编版语文七年级上册.pptx VIP
文档评论(0)