P2P网贷平台情感分析系统的设计与实现.pdf

P2P网贷平台情感分析系统的设计与实现.pdf

  1. 1、本文档共59页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
摘 要 P2P (Peer to Peer )网贷平台情感分析用于提取网络文本中的借贷实体并对其进行 情感分析,所得结果影响用户后续的决策行为。传统贷款平台提取及分析方法大都需人 工参与,费时费力且获取结果和极性判别效果并不理想。本课题设计与实现网贷平台情 感分析系统。系统基于卷积神经网络CNN (Convolutional Neural Network )以及循环神 经网络RNN (Recurrent Neural Network )构建提取和极性判别算法模型,能够自动实现 网贷平台提取与情感极性判别,可提升实体抽取效率及情感判别准确度。 本文分析国内外文本情感分析系统研究现状,针对网络金融文本语料信息,通过需 求分析及系统设计实现P2P 网贷平台情感分析系统。论文主要工作与研究内容如下: (1)数据预处理。对网络金融文本数据统一进行去重、去噪等数据清洗工作,针 对后续不同任务分别进行文本序列标注、文本分句表示处理和实体位置获取。 (2 )网贷平台实体提取算法模型选择。分别构建基于长短期记忆网络(Long Short-Term Memory,LSTM )及基于膨胀卷积神经网络(Iterated Dilated Convolutional Neural Network,IDCNN )的算法模型。然后针对不同规模网络金融文本数据集进行对 比实验。基于LSTM 的算法模型均可达到97% 以上平均准确率,而基于IDCNN 的提取 模型则能够达到98.9%及以上的平均准确率。实验结果表明基于IDCNN 提取模型具有 损失小、正确率高的特性。因此我们选择该模型实现网贷平台实体的提取。 (3 )网贷平台极性判别算法模型选择。论文分别采用LSTM 以及双向长短期记忆 网络(Bidirectional Long Short-Term Memory,BILSTM ),将网贷平台提取结果及对应 文本信息作为输入。两个模型F1 值均达到90% 以上。实验表明基于BILSTM 的情感极 性判别模型更优。因此选择该模型用于情感分析系统的网贷平台情感判别。 (4 )模型训练。采用谷歌发布的BERT 中文预训练模型对网络文本数据训练词向 量,并使用K 折交叉验证算法进行模型训练以及性能评估。 (5 )系统实现。系统选用Visual Studio Code 作为前后端开发工具。前台结合Vue 、 Elementui 以及Echarts 实现功能模块设计及数据显示。后台通过Python 进行算法设计, Ajax 实现前端数据传输、获取及网贷平台提取以及极性判别算法接口调用。 关键词:P2P 网贷平台;BERT ;文本情感分析;命名实体识别;长短期记忆网络 III 目 录 摘 要 III Abstract IV 1 绪 论 1 1.1 研究背景 1 1.2 研究目的和意义 1 1.3 国内外研究现状2 1.4 研究内容 4 1.5 论文组织结构 5 2 相关理论与技术7 2.1 文本预处理技术 7 2.2 预训练技术 7 2.2.1 传统预训练技术8 2.2.2 主流预训练技术8 2.3 深度神经网络 10 2.3.1 长短期记忆网络LSTM 10 2.3.2 卷积神经网络CNN 11 2.4 实体识别技术 13 2.4.1 命名实体识别技术 13 2.4.2 CRF 条件随机场模型 14 2.5 本章小结 15 3 网贷平台提取算法研究与模型构建 16 3.1 文本数据预处理 16 3.1.1 数据信息以及清洗 16 3.1.2 序列标注 17 3.2 网贷实体提取算法模型构建 18 3.2.1 BERT-CRF 算法模型构建流程 19 3.2.2 BERT-LSTM-CRF 算法模型构建过程 19 3.2.3 BERT-BIL

文档评论(0)

136****6583 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:7043055023000005

1亿VIP精品文档

相关文档