基于频繁关键字共现的诗词风格分类模型研究pdf.pdf

基于频繁关键字共现的诗词风格分类模型研究pdf.pdf

  1. 1、本文档共4页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于频繁关键字共现的诗词风格分类模型研究pdf

第 47 卷  第 1 期 ( ) Vol . 47  No . 1 厦门大学学报 自然科学版  2008 年 1 月 J our nal of Xiamen U niver sit y (N at ural Science) J an . 2008   基于频繁关键字共现的诗词风格分类模型研究 吴春龙 ,周昌乐 (厦门大学信息科学与技术学院 ,艺术认知与计算实验室 ,福建 厦门 36 1005) ( ) 摘要 : 为了提高宋词文档分类的精确性 ,本文在广泛采用的向量空间模型 Vector sp ace model ,V SM 的基础上 ,对分类 算法中使用的特征项做了相应的修改 ,提出了频繁关键字共现的概念. 在实验过程中 ,首先提取了宋词语料库中的关键 字 ,再利用发现关联规则的 Ap riori 算法发现分类时所需要的频繁关键字共现 ,最后结合关键字和频繁关键字共现 ,利用 ( ) 最邻近算法 KNN 对宋词文档进行风格分类. 实验结果发现 ,结合了频繁关键字共现的 V SM 可以提高对宋词风格分类 的准确度. 可见 ,频繁关键字共现确实提供了风格分类中所需的更多信息. 关键词 : 文本分类 ; 向量空间模型 ; F KCV SM ;最邻近算法 ;Ap riori 算法 ;频繁关键字共现 中图分类号 : TP 18     文献标识码 :A      文章编号 (2008) 0 1004 104   诗词作品的风格分类 ,可以将其视为一种文本分 大致分为豪放和婉约两种风格类型 ,得到了较好的实 类问题. 但由于诗词风格的自身的特点 ,文本分类中常 验结果. 用的向量空间在风格分类方面却无法取得令人理想的 效果. 1  基于关键字共现的文本特征提取思 《现代汉语小词典》对诗词风格的解释是 :“文艺作 想 品所表现出的主要的思想特点和艺术特点”. 而《辞 通过大量的阅读 ,我们发现 ,宋词的风格是通过整 海 ·文学分册》则认为风格是“写作主体在创作中所表 首宋词所采用的一个个词语“集体”体现出来的 ,单个 现出来的艺术特色和创作个性. ”一般说来 ,“风格就是 词语并不具备这样的影响能力. 人们也正是在阅读完 作品的风貌与格调. 风格与作品的内容直接有关 ,与作 整首作品后才根据作者所使用的词汇以及其他因素来 品的艺术表现直接有关 ,更是作者的精神面貌 、才质修 [ 1 ] 判断一首宋词属于何种风格类型. 例如《东坡乐府》中 , 养 、审美情趣等主观因素在作品中的体现” . 综观上 最具有英雄气概的代表作 ,首推被誉为“千古绝唱”的 述观点 ,一篇文学作品中单个字 、词或者词组并不能完 [3 ] 《赤壁怀古》 苏轼的《念奴娇》: 整体现其风格 ,它们结合在一起才反映出诗词的整体 大江东去 ,浪淘尽

您可能关注的文档

文档评论(0)

yan698698 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档