- 1、本文档共4页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于语句类似度优化计算的改进自动摘要算法研究 - 计算机应用与软件
第30卷第9期 计算机应用与软件 Vol30No.9
2013年9月 ComputerApplicationsandSoftware Sep.2013
基于语句类似度优化计算的改进自动摘要算法研究
1 2
高雪霞 贾海龙
1(新乡学院计算机与信息工程学院 河南新乡453003)
2(新乡学院现代教育技术中心 河南新乡453003)
摘 要 计算语句的类似度在自动问答、机器翻译、信息检索和自动摘要等算法中有着非常重要的作用。首先归纳了语句类似度
计算的方法,综合考虑关键词特征、语义特征、句式特征和语句长度特征等信息并提出一种优化语句类似度计算方法,以语句权重计
算方法以及冗余处理优化处理为基础,实现一个改进的自动摘要算法。通过在DUC的测评语料上进行仿真,实验结果证明了该算
法对于摘要质量优化的高效性。最后,讨论了自动摘要研究存在的问题,并指出自动摘要的研究趋势。
关键词 语句类似度 自动摘要 语句权重计算 冗余处理
中图分类号 TP391 文献标识码 A DOI:10.3969/j.issn.1000386x.2013.09.044
ONAUTOMATICABSTRACTINGALGORITHMBASEDONOPTIMISEDSENTENCES
SIMILARITYCALCULATION
1 2
GaoXuexia JiaHailong
1(CollegeofComputerandInformationEngineering,XinxiangUniversity,Xinxiang453003,Henan,China)
2(ModernEducationTechnologyCenter,XinxiangUniversity,Xinxiang453003,Henan,China)
Abstract Calculatingthesentencesimilarityplaysanimportantroleinalgorithmsofautomaticquestionanswering,machinetranslation,
informationretrievalandautomaticabstracting,etc.Inthisarticle,firstlywesumupthemethodsofcalculatingthesentencessimilarity,and
thenbringforwardanewmethodofoptimisingthesentencessimilaritycalculationbysyntheticallytakingintoconsiderationtheinformationin
cludingkeywordscharacters,semanticcharacters,sententialformcharactersandsentencelengthcharacters,etc.Moreover,weimplement
animprovedautomaticabstractingalgorithmonthebasisofsentencesweightcomputationandredundancyresolutionoptimisation.Throughthe
simulationonDUCevaluationcorpuses,theexperimentalresultprovestheefficiencyofthisalgorithminabstractingqualityoptimisation.In
endofthepaper,wediscusstheproblemsexistedinautomatic
文档评论(0)