- 1、本文档共59页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
摘 要
P2P (Peer to Peer )网贷平台情感分析用于提取网络文本中的借贷实体并对其进行
情感分析,所得结果影响用户后续的决策行为。传统贷款平台提取及分析方法大都需人
工参与,费时费力且获取结果和极性判别效果并不理想。本课题设计与实现网贷平台情
感分析系统。系统基于卷积神经网络CNN (Convolutional Neural Network )以及循环神
经网络RNN (Recurrent Neural Network )构建提取和极性判别算法模型,能够自动实现
网贷平台提取与情感极性判别,可提升实体抽取效率及情感判别准确度。
本文分析国内外文本情感分析系统研究现状,针对网络金融文本语料信息,通过需
求分析及系统设计实现P2P 网贷平台情感分析系统。论文主要工作与研究内容如下:
(1)数据预处理。对网络金融文本数据统一进行去重、去噪等数据清洗工作,针
对后续不同任务分别进行文本序列标注、文本分句表示处理和实体位置获取。
(2 )网贷平台实体提取算法模型选择。分别构建基于长短期记忆网络(Long
Short-Term Memory,LSTM )及基于膨胀卷积神经网络(Iterated Dilated Convolutional
Neural Network,IDCNN )的算法模型。然后针对不同规模网络金融文本数据集进行对
比实验。基于LSTM 的算法模型均可达到97% 以上平均准确率,而基于IDCNN 的提取
模型则能够达到98.9%及以上的平均准确率。实验结果表明基于IDCNN 提取模型具有
损失小、正确率高的特性。因此我们选择该模型实现网贷平台实体的提取。
(3 )网贷平台极性判别算法模型选择。论文分别采用LSTM 以及双向长短期记忆
网络(Bidirectional Long Short-Term Memory,BILSTM ),将网贷平台提取结果及对应
文本信息作为输入。两个模型F1 值均达到90% 以上。实验表明基于BILSTM 的情感极
性判别模型更优。因此选择该模型用于情感分析系统的网贷平台情感判别。
(4 )模型训练。采用谷歌发布的BERT 中文预训练模型对网络文本数据训练词向
量,并使用K 折交叉验证算法进行模型训练以及性能评估。
(5 )系统实现。系统选用Visual Studio Code 作为前后端开发工具。前台结合Vue 、
Elementui 以及Echarts 实现功能模块设计及数据显示。后台通过Python 进行算法设计,
Ajax 实现前端数据传输、获取及网贷平台提取以及极性判别算法接口调用。
关键词:P2P 网贷平台;BERT ;文本情感分析;命名实体识别;长短期记忆网络
III
目 录
摘 要 III
Abstract IV
1 绪 论 1
1.1 研究背景 1
1.2 研究目的和意义 1
1.3 国内外研究现状2
1.4 研究内容 4
1.5 论文组织结构 5
2 相关理论与技术7
2.1 文本预处理技术 7
2.2 预训练技术 7
2.2.1 传统预训练技术8
2.2.2 主流预训练技术8
2.3 深度神经网络 10
2.3.1 长短期记忆网络LSTM 10
2.3.2 卷积神经网络CNN 11
2.4 实体识别技术 13
2.4.1 命名实体识别技术 13
2.4.2 CRF 条件随机场模型 14
2.5 本章小结 15
3 网贷平台提取算法研究与模型构建 16
3.1 文本数据预处理 16
3.1.1 数据信息以及清洗 16
3.1.2 序列标注 17
3.2 网贷实体提取算法模型构建 18
3.2.1 BERT-CRF 算法模型构建流程 19
3.2.2 BERT-LSTM-CRF 算法模型构建过程 19
3.2.3 BERT-BIL
您可能关注的文档
最近下载
- 江苏省2024届高三上学期10月大联考英语试卷(含答案).docx VIP
- (英文绘本)安东尼·布朗《我妈妈》My Mum.pdf
- Risk软件在微生物定量风险评估中的应用-食品微生物安全与.PDF VIP
- 《品牌形象策划》课程教学大纲(本科).pdf
- 23S516 混凝土排水管道基础及接口图集.docx VIP
- 2023年电工(技师)证考试题库及答案.docx
- 商务词汇使用Businessvocabularyinuse.pdf VIP
- 2024脑脊液漏规范化管理中国专家共识(全文) .pdf VIP
- 新质生产力推动高质量发展(下)考试 .docx VIP
- 2019语文高考小说的叙述角度人称作用.pptx
文档评论(0)