- 1、本文档共25页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
PAGE2
CNN和RNN两种网络模型在文本数据上的分类性能对比分析
摘要
受计算机网络发展的影响,同时作为自然语言处理领域的热门应用之一,在处理网络数据上,文本分类技术已经变得不可或缺。如今互联网上文本数量呈指数水平增长,研究有效处理网络数据的办法也日益受到人们的重视。随着传统的分类方法已不再满足需求,以及深度学习模型优势的日渐显露,于是新的模型开始应用在了文本分类领域。本文总结了CNN和RNN两种网络模型的原理,通过字级别的分词方法遍历整个新闻文本数据,分别构建了基于CNN、RNN的文本神经网络模型,使用Adam法进行参数更新,并加入防止过拟合的相关操作,进行分类实验。实验主要通过计算召回率、F值、精确率,来对比两个模型在文本数据上的分类性能。实验结果显示,在使用TextCNN模型时,测试的准确率达到了96.04%,用时5秒。而用TextRNN模型对同一批数据进行训练后,测试的准确率只达到了94.22%,用时33秒。说明本文构建的TextCNN要比TextRNN在新闻文本上预测的更准确,更具有显著的分类优势。
关键词:TextCNN模型;TextRNN模型;自然语言处理;深度学习;文本分类
目录
TOC\o1-3\h\z\u摘要 I
Abstract II
第1章引言 1
1.1背景与意义 1
1.2国内外研究现状 1
1.3论文主要工作 2
第2章相关算法模型 3
2.1卷积神经网络 3
2.1.1卷积神经网络介绍 3
2.1.2文本卷积神经网络 3
2.2循环神经网络 6
2.2.1循环神经网络介绍 6
2.2.2长短期记忆网络 7
2.2.3门控循环单元网络 8
第3章仿真实验 10
3.1实验准备 10
3.1.1实验环境 10
3.1.2实验数据 10
3.1.3预处理 10
3.1.4评价指标 11
3.1.5参数设置 12
3.2实验过程 13
3.2.1构建网络模型 13
3.2.2训练与测试 15
3.3实验结果 15
3.3.1训练结果 15
3.3.2测试结果 18
3.4实验对比分析 19
第4章结语 21
参考文献 22
PAGE2
引言
背景与意义
由于5年前AlphaGoREF_Re\r\h[1]战胜了人类围棋职业选手这件事所产生的轰动影响,使得人工智能、机器学习、深度学习这些名词得到了迅速地普及,在人类的发展长河中,对人工智能有着很多大胆的想象,比如电影《生化危机》、《西部世界》和《终结者》,这些想象让我们觉得人工智能很遥远,但其实我们身边已经有了它们的存在,比如Siri、小爱就属于人工智能的一类产品。机器学习是实现人工智能的一种方式,深度学习是机器学习的一个分支REF_Re\r\h[2],机器学习可以理解为用数据驱动机器实现算法的能力REF_Re\r\h[3]。随着数据的收集手段和能力的提升,机器学习作为大数据分析的主要工具,越来越受到人们的重视REF_Re\r\h[4]。深度学习作为机器学习方法下的一个重要子类别,在实际生活中也已经有了很多的应用实例。比如:电商行业的个性推荐,金融行业的服务评估和智能驾驶领域的识别路线,深度学习技术已经渗透到很多的行业和领域了。
最近几年,深度学习的优势不断显现,在很多领域都表现不凡,这就有了后来产生将其应用在自然语言处理领域的想法。自然语言处理(NLP)主要研究的是如何用恰当的形式来表示人类的语言,而文本分类是其中的一个重要工作,如何获取有效数据,并对文本进行分类已经成为一个重要的研究话题REF_Re\r\h[5]。而文本分类,字面意思就是根据文本的内容,将其归类到一个或多个类别中REF_Re\r\h[6]。随着信息技术和互联网的发展,以及手机和电脑更加地便捷化,我们获取的文本信息也正在爆炸式地涌现,文本分类成为了人们生活中处理数据的不可或缺的技术,基于文本分类技术的应用场景,在我们的生活中也是随处可见REF_Re\r\h[7],例如商品交易平台的评价分类、网站的舆情分析和问答软件上的问句分类。文本分类技术不仅可以高效地处理数据,便捷我们的生活,还可以总结数据中隐含的现象和规律,从而可以对未知事件进行预测。
国内外研究现状
早在20世纪50年代末,国外的科学家就开始了对
您可能关注的文档
- 《CCD影像设计的案例综述》2100字.docx
- 《C公司A项目基坑支护工程进度管理现状、问题及完善对策研究》15000字.doc
- 《C市四层公租房的建筑结构设计》11000字.docx
- 《Dijkstra算法在清扫机器人路径规划中的能耗优化研究》11000字.doc
- 《DSG变速器的双离合器设计》12000字.doc
- 《DTP药房的风险管理研究理论基础及国内外文献综述》4600字.docx
- 《DTP药房管理中静脉注射类创新药物患者用药风险识别分析综述》5400字.docx
- 《DTP药房中静脉注射类创新药物现状分析综述》7300字.docx
- 《EGR技术和SCR技术在船舶柴油机上的应用研究》11000字.docx
- 《EVA企业价值评估法在互联网企业中的应用案例分析—以“哔哩哔哩科技有限公司”为例》11000字.doc
最近下载
- 水产品加工学课件(PPT 61页).ppt
- 睡眠信念和态度问卷(DBAS).doc VIP
- GB 50026-2020 工程测量标准.docx
- 防滑地砖楼地面施工工艺流程.doc
- 楼地面工程监理细则(DOC).docx VIP
- 2×105平方米烧结机机头烟气脱硫工程可行性研究报告.doc
- 页岩气战略调查井钻井技术要求.pdf VIP
- 【部编版】《道德与法治》三年级下册第8课《大家的“朋友》优质课件.pptx
- 7.2 亚洲的人文环境(课件)-【开课了】2024-2025学年七年级地理下册同步备课课件+教学设计(人教版2024).pptx VIP
- GB50229-2019 火力发电厂与变电站设计防火标准.docx
文档评论(0)