机器学习系列报告之二:机器学习合成非线性因子,增强效果.pdf

机器学习系列报告之二:机器学习合成非线性因子,增强效果.pdf

  1. 1、本文档共41页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
权 益 量 化 研 究 2021 年03 月12 日 机器学习合成非线性因子,增强效 权 果如何? 益 量 化 —— 机器学习系列报告之二 研 究 相关研究 本期投资提示: 《量化投资新起点——机器学习系列报 证 告之一》2020 年 9 月 1 日 ⚫ 因子有效性随市场变化,因子合成面临挑战。在经典的多因子选股框架里,等权法合成因 券 研 子较为常见,特点是简单直观,但无法体现因子间的差异。IC 加权法包含了因子的动量信 究 息,以及因子之间的差异,但无法体现因子之间的交互作用。而机器学习可以寻找大量数 报 据之间的映射(非线性)关系。 告 ⚫ 机器学习因子合成:使用规模、估值、分红、盈利、财务质量、成长、反转、波动率、流 动性、分析师一致预期 10 大类风格因子。应用机器学习模型,进行 24 个月滚动训练。 分别测试逻辑回归、朴素贝叶斯、支持向量机、决策树、随机森林、梯度提升树、XGBoost、 LightGBM、神经网络九种模型。 ⚫ 合成因子的多头组合相对等权组合有一定的增强作用,空头组合不同机器学习模型表现分 化加大。多头组合中神经网络表现最好,其次是随机森林和 XGBoost。决策树表现最差, 几乎没有提升效果。空头组合中基于决策树的集成模型表现最好,较好地控制了年化波动 率和最大回撤。合成因子多数年份表现优于追求动量的 IC 加权法,2017、2018 年表现 较差。 ⚫ 通过对单因子的边际依赖函数进行线性回归拟合,可以将单因子的边际影响拆分为线性和 非线性两部分。以神经网络为例在 2020 年的训练结果为例,规模、流动性、盈利、成长 因子的变化对预测值的非线性影响较大,而分红、财务质量、分析师一致预期的变化则几 乎全部为线性影响。机器学习模型训练过程中,各类因子的贡献变化与 IC 的变化较为一致。 ⚫ 合成因子与流动性、波动率这两个因子相关性最高,其次是反转、估值、规模,与财务质 量因子相关性最低。机器学习模型或许更适用于技术面因子,但提升的是空头组合收益。 基本面因子的回测结果显示,不论是多头组合还是空头组合,机器学习模型相对于等权组 合并没有提升。而从技术面因子的回测结果看,机器学习模型可以一定程度上提高空头组 合的年化表现。 ⚫ 在特征和数据较少的情况下,模型很难充分学习数据的特征。在这种情况下,线性模型的 表现也要优于复杂的非线性模型。将样本池由全市场换为中证 500,由于训练样本数量明 显减少,机器学习模型的效果并不突出。对于多头组合的表现并没有

文档评论(0)

topband + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:6022005030000000

1亿VIP精品文档

相关文档