- 1、本文档共6页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于词向量模型的对话文本短文本意图分类方法
基于词向量模型的对话文本短文本意图分
类方法
高廷丽, 陶建华, 杨明浩, 孙梦伊, 张大伟
中国科学院自动化研究所模式识别国家重点实验室,北京100190
摘 要:人机对话系统中,在不限定用户输入语句或者不限定语句模式的情况下,环境噪声以及方言口音
语音识别错误等原因,使得计算机对用户对话意图判断错误,导致计算机针对用户的反馈语句出现“答非
所问”的情况,影响了人机对话系统用户的体验感。为了提高对话系统中意图识别的准确率,本文将词向
量的语义挖掘能力应用到对话系统的意图分类中。实验结果表明,该方法比传统的基于LDA 模型的方法和、
基于n-gram 模型的方法在短文本分类方面具有更高的准确率,在多类意图分类中,具有更好的稳定性和可
扩展性,能很好的适用于对话系统中的短文本类型的用户意图判断。
关键词 词向量,LDA,意图分类
投稿会议 CHCI2015
A method of intention classification for dialogue system
Tingli Gao ,Jianhua Tao, Minghao Yang, Mengyi Sun, Dawei Zhang
National Laboratory of Pattern Recognition (NLPR), Institute of Automation, Chinese Academy of Sciences, Beijing, China
Abstract In human machine dialog system, In the case of the user’s input statement (or
statement mode) is not limited, due to the error of speech recognition and other reasons, will cause
the system is difficult to accurately determine the users dialogue intention. It’s will cause the
system appear give an irrelevant answer for users feedback statements. This situation brings the
interruption of the dialogue, the user’s experience of the man-machine dialogue system is affected
to a certain extent. In order to improve the accuracy of intention recognition in the dialogue
system, In this paper, the semantic mining ability of word vector is applied to the intention
classification of the dialogue system. Experimental results show that, the proposed method has
higher accuracy than the traditional LDA based method and the n-gram based method. In the
classification of the intention of more classes, the stability and scalability of this method is better.
Key words word2vec, LDA, Intention classification
台的网络女虚拟主播Ananova[5] ,日本名古
1 引言:
您可能关注的文档
- 苏教版小学数学二年级下册第一单元.ppt
- 培训系统学员操作手册.doc
- 英国兰卡斯特大学学习体验分享12级人力资源管理专业李梦远.PDF
- 英语教案设计rainysunnysnowy.doc
- 基于3C教育理念的C语言课程教学改革研究.PDF
- 英语阅读文摘第三期(2012年12月).PDF
- 范家辉简历.doc
- 基于ARM和VxWorks的PC104总线模块检测系统.PDF
- 荆盼个人介绍.PDF
- 荣安地产股份有限公司关于召开2018年第八次临时股东大会的.PDF
- 2024年江西省寻乌县九上数学开学复习检测模拟试题【含答案】.doc
- 2024年江西省省宜春市袁州区数学九上开学学业水平测试模拟试题【含答案】.doc
- 《GB/T 44275.2-2024工业自动化系统与集成 开放技术字典及其在主数据中的应用 第2部分:术语》.pdf
- 中国国家标准 GB/T 44275.2-2024工业自动化系统与集成 开放技术字典及其在主数据中的应用 第2部分:术语.pdf
- GB/T 44285.1-2024卡及身份识别安全设备 通过移动设备进行身份管理的构件 第1部分:移动电子身份系统的通用系统架构.pdf
- 《GB/T 44285.1-2024卡及身份识别安全设备 通过移动设备进行身份管理的构件 第1部分:移动电子身份系统的通用系统架构》.pdf
- 中国国家标准 GB/T 44285.1-2024卡及身份识别安全设备 通过移动设备进行身份管理的构件 第1部分:移动电子身份系统的通用系统架构.pdf
- GB/T 44275.11-2024工业自动化系统与集成 开放技术字典及其在主数据中的应用 第11部分:术语制定指南.pdf
- 中国国家标准 GB/T 44275.11-2024工业自动化系统与集成 开放技术字典及其在主数据中的应用 第11部分:术语制定指南.pdf
- 《GB/T 44275.11-2024工业自动化系统与集成 开放技术字典及其在主数据中的应用 第11部分:术语制定指南》.pdf
文档评论(0)