深度学习研究报告:股价预测之多模态多尺度.docx

深度学习研究报告:股价预测之多模态多尺度.docx

  1. 1、本文档共29页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

图表索引

图1:AI看图——基于卷积神经网络的股价走势AI识别与分类 5

图2:多模态多尺度股价预测模型 6

图3:10分档表现(全市场) 9

图4:RankIC表现(全市场) 9

图5:多头及超额表现(全市场) 9

图6:10分档表现(沪深300) 11

图7:RankIC表现(沪深300) 11

图8:多头及超额表现(沪深300) 11

图9:10分档表现(中证500) 13

图10:RankIC表现(中证500) 13

图11:多头及超额表现(中证500) 13

图12:10分档表现(中证800) 15

图13:RankIC表现(中证800) 15

图14:多头及超额表现(中证800) 15

图15:10分档表现(中证1000) 17

图16:RankIC表现(中证1000) 17

图17:多头及超额表现(中证1000) 17

图18:10分档表现(国证2000) 19

图19:RankIC表现(国证2000) 19

图20:多头及超额表现(国证2000) 19

图21:10分档表现(创业板) 21

图22:RankIC表现(创业板) 21

图23:多头及超额表现(创业板) 21

图24:循环神经网络结构 23

图25:Transformer模型结构 24

图26:LeNet-5网络结构图 25

图27:VGG16网络结构图 25

图28:卷积(Convolution)运算示意图 26

图29:填充(Padding)示意图 26

图30:步幅(Stride)为2的卷积运算示意图 27

图31:池化(Pooling)运算示意图 28

表1:本文模型因子和Barra风格因子之间的相关性 8

表2:分年度收益统计(全市场) 10

表3:分年度收益统计(沪深300) 12

表4:分年度收益统计(中证500) 14

表5:分年度收益统计(中证800) 16

表6:分年度收益统计(中证1000) 18

表7:分年度收益统计(国证2000) 20

表8:分年度收益统计(创业板) 22

一、AI看图

基于价量数据对未来股价走势进行预测作为一类重要的机器学习量化选股策略,在过去受到了广泛的研究和应用。由于个股的价量数据是随着交易活动的进行而产生的,其本质上是关于时间的一组序列。因此,为了建模价量数据与未来股价走势之间的关系,大多数研究方法自然而然地使用了循环神经网络(RecurrentNeuralNetwork,RNN)或Transformer这两大类时序模型。

在这些方法中,模型的输入是关于价量数据的一维或多维数组,输出则是股价的未来走势。然而,尽管时序模型在一定程度上能够捕捉到价量序列中诸如价格、交易量的上涨或下跌及其相互交织的高维信息,但其无法对价格和交易量的走势形态及其变化进行有效识别。

举个例子对此进行解释。以人类视角来看,通常在对股价的未来走势进行预测时,并不会选择直接观测一组关于价量的序列,因为能从中捕获到的不只是数字上的涨跌。为了能更好地捕捉到价格和交易量的形态走势,通常会选择观测包含k线图、移动平均价、交易量、MACD数据的图表,而不是一组纯粹的数字。

基于以上观点,团队在去年发布的《基于卷积神经网络的股价走势AI识别与分类》研究报告中,创新性地基于日度价量数据,批量生成标准化价量数据图表。该图表包含了窗口期大小为20日的价量数据,其由三部分组成:(1)图表的上部分由k线图和移动平均线构成,包含了开、高、低、收价格,以及若干股价的移动平均线,如MA5、MA10等;(2)图表的中部分由当日对应的成交量构成;(3)图表的下部分由股价的MACD信息构成。

AI看图采用基于深度学习的图像识别技术,将价量数据图表与未来股价走势进行建模,以实现股价预测,整体模型结构如下图1所示。

图1:AI看图——基于卷积神经网络的股价走势AI识别与分类

数据来源:

二、多模态多尺度股价预测模型

(一)模型结构

本文以“多模态、多尺度”为题,基于AI看图初始版本模型进行了大幅改进,新的模型结构如下图2所示。本文模型在日度价量数据图表的基础上,加入了高频因子数据、日频时序数据、周度价量数据图表,采用4个独立的深度时序模型和深度卷积模型进行多模态、多尺度的特征提取,并同时采用回归损失和分类损失以端到端的方式进行模型训练,有效提升了模型对未来股价的预测能力。

图2:多模态多尺度股价预测模型

数据来源:

(二)改进思路

本文模型主要有以下几个改进思路:

多模态:尽管价量数据图表所蕴含的信息完全来自于

您可能关注的文档

文档评论(0)

535600147 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:6010104234000003

1亿VIP精品文档

相关文档