教程介绍因子汇.pdfVIP

  1. 1、本文档共8页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

因子文档

一、基本说明

说明:这个项目的目标是找到一些能够预测未来收益率的因子。这些因子最后都

可以作为实际的信号。

%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%

%%%%%%%

确定时间尺度:初步确定是使用分钟的bar,即t时刻和t+1时刻相差1个tick。

同时,确认预测往后预测的尺度,初步确定这个尺度是15秒(30个tick)

因子计算方式:在任何时点t,利用t时刻之前的价量数据计算一个信号

signal(t),最终得到一个时间序列signal.

收益率计算:在任何一个时间t,计算15秒的收益率,即

R(t)=(P(t+30)-P(t))/P(t)

注意到P(t)都是价格:即

(bidprice*askvolume+askprice*bidvolume)/(bidvolume+askvolume)

因子的目标:IC最大化。一个因子的IC为它和未来收益率的相关性的绝对值:

IC=|corr(indicator,R(t))|

这里的IC指的是把所有日期的数据连在一起后计算的总IC。

初步认为IC至少在0.05以上才可以接受,但最终肯定是越大越好。

同时需要IC稳定,即不同时间测试的日IC的标准差尽量小。

此外,每个因子尽量能实现均值稳定,分布对称(这可以通过平移来实现)。我

们最后会有一些其他检验效果的指标,例如散点图,分布图和单因子回归的R方

等等。

结果形式:

1.最终每个因子都写成函数的形式

函数的名称就是因子的名字,如果是自己创建的指标,用自己取的名字就好。

函数参数:至少包含两个参数:data,bar的长度(比如1sec,2个tick,所以是

2)、第三个参数可以由自己给定,里面包含指标的相关参数。但前面两个参数需

要按要求写。

返回值:两个与data行数相等的列向量,signal与indicator;signal代表是否产生预

测,如bar=2时,每2个数据产生一个预测,signal每1个0后面一个1;indicator是每

个时刻的因子值,signal为零时对应的indicator也为零;Signal在开头处可能有连

续很多0,不同的因子会有不同。

2.简单报告

Signaltest函数的应用:

输入:数据存放位置,市场,开始日,结束日,bar长度,预测长度,因子预热

长度,信号函数。一点解释:市场参数输入为y1309时,只算1309的合约;y的

时候,则不限于1309;

输出:总IC,每日IC均值,每日IC标准差,总R方,三个图表:return与因子

的对比图,return与因子的直方分布图对比,散点图(横轴为因子值,纵轴为return)

以及线性拟合的结果(单因子)。

范例:这里我们bar长度为2,即一分钟,预测长度为30,即15秒,预热长度2000。

result=signaltest(H:\\中信\策略\2013数据,y1309,2013-05-20,2013-

05-31,2,30,2000,@signalgen);

%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%

%%%%%%%

参考建议:

1.关于数据的问题。我们给出的数据是经过简单的,但实际计算信号的时

候,可能需要注意一下数据异常。例如,收益率或者某些时候量的异常,

可能会导致指标的异常,从而影响计算IC。我们的建议是,可以对收益率和

和计算的指标都进行统计筛选,所有偏离均值太远的(比如说1%分位点)数

据直接剔除)。

2.因子的:可以是任何简单的技术指标,如MACD、RSI等等,也可以是

自己构造的价量指标。

3.一般来说,直接构造的因子会有异常值、形式不统一、趋势太强等问题,而

收益率序列是一个被证实为接近t分布的变量,且相对比较平稳的序列。因

文档评论(0)

wx5620 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档