- 1、本文档共41页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
中文产品评论的意见挖掘研究北京交通大学答辩
细颗粒意见分析 细颗粒意见分析实验 从京东网随机选择500条句子,包含280个褒义评论句子,150个贬义评论句和70条个褒贬都有的评论句。 共标记极性词904个。其中含有否定词的句子比例为18%,含有强调词的比例为35%,含有产品特征相关的极性词为13%。 * * 评论句子内容 产品特征词 极性词 强度 褒贬色彩 Q8在运行速度上的表现,在目前同品牌的手机型号中绝对是最优秀的! 运行速度 优秀 +2 支持 它的外观设计新颖,拿在手上相当酷。 外观 新颖 酷 +1 +2 支持 相当支持 我昨天刚买了诺基亚5230,今天就降价了!不过它的性价比还是相当高的。 诺基亚 性价比 高 +2 客观 相当支持 这款手机的屏幕很炫,不过电池不怎么耐用! 屏幕 电池 炫 不耐用 +1 -1 相当支持 反对 细颗粒意见分析 细颗粒意见分析实验(续) 共标记产品特征词953个,其中对特征词表达了有效的情感意见的关系对共有818对。 * * 算法 正确匹配数量 准确率 依存句法 515/818 62.9% 关键字匹配 777/818 96.2% 实验结论:关键匹配的方法的分析性能好于依存句法的方法分析。分析原因:依存句法的方法对句法分析结果的依赖过重。 主要内容 研究背景和意义 1 整体褒贬分类研究 2 细颗粒意见分析研究 3 意见挖掘系统设计与实现 4 * * 北京交通大学硕士学位论文答辩 总结和展望 5 参考文献 6 5 5 3 意见挖掘系统设计与实现 整体设计 * * 意见挖掘系统设计与实现 评论下载与内容抽取 * * 编号 XPath路径 1 /html/body/form/div[7]/div[2]/ul[2]/li[2]/div[2]/dl/dd 2 /html/body/form/div[7]/div[2]/ul[2]/li[2]/div[2]/dl[2]/dd 3 /html/body/form/div[7]/div[2]/ul[2]/li[2]/div[2]/dl[3]/dd 4 /html/body/form/div[7]/div[3]/div/p[2]/a 意见挖掘系统设计与实现 * * 产品评论管理界面 意见挖掘系统设计与实现 * * 产品意见比较查询界面 意见挖掘系统设计与实现 * * 产品意见查询界面 总结 1 采用机器学习的方法对产品评论进行整体褒贬分类研究。分析比较不同因素对分类结果的影响。 2 构建产品特征库和中文极性词典。 分析比较基于依存句法分析和关键字匹配的细颗粒意见挖掘算法 3 设计并实现了一个产品评论意见挖掘系统。 * * 北京交通大学硕士学位论文答辩 展望 进一步挖掘针对情感分类的特征提取方法。 进一步完善对复杂评论的处理能力。 进一步完善中文产品评论语料库的构建。 * * 致谢 硕士学位论文 指导、关怀、支持、鼓励 同学 父母 实验室 老师们 导师 * * 北京交通大学硕士学位论文答辩 * * Thanks! 请老师批评指正! * * * 北京交通大学硕士学位论文答辩 BJTU 北京交通大学硕士学位论文答辩 BJTU 北京交通大学硕士学位论文答辩 中文产品评论的意见挖掘研究 Research on Opinion Mining of Product Reviews in Chinese * * 北京交通大学硕士学位论文答辩 答辩人:严孙荣 导师:瞿有利副教授 主要内容 研究背景和意义 1 整体褒贬分类研究 2 细颗粒意见分析研究 3 意见挖掘系统设计与实现 4 * * 北京交通大学硕士学位论文答辩 总结和展望 5 6 5 5 3 * * 问题的产生 电子商务飞速发展,用户在使用产品之后会在网上发表对产品的评论。 从纷繁复杂的网络世界中准确而快速地获取所需信息并非易事。 产品评论意见挖掘 对网上大量的评论信息进行挖掘,通过采用自然语言处理技术,对自然语言描述的无结构的用户产品评论中进行自动挖掘,找到有用的信息,并以直观的方式对挖掘结果进行表示。 研究意义 帮助用户购买适合自己的产品。 帮助厂家生产符合社会需求的产品。 研究背景和意义 * * 研究现状 ReviewSeer :由Dave等人研究并开发,是世界上第一个情感分析工具和第一个针对给定产品评论区别其褒贬性的系统。 Pulse :由Gamon等人研究并开发,可以自动挖掘网上用户所上载的自由文本中有关汽车评价中的贬褒信息和强弱程度。 Opinion Observer :由Liu等人研究并开发的,可以处理网上在线顾客产品评价,并采用可视化方式对若干种产品特征的综合质量进行比较。 WebFountain :由Yi和Niblack研究并开发了,WebFountain系统是一个基于多类型数据、开放领域意见挖掘的研究和开发平台。 Opinio
文档评论(0)