江海潮涌,星辰引航:量化因子掘金系列(三),遗传算法因子挖掘与因子非线性合成.docx

江海潮涌,星辰引航:量化因子掘金系列(三),遗传算法因子挖掘与因子非线性合成.docx

  1. 1、本文档共19页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

目 录

研究背景 3

遗传算法介绍 4

符号回归 4

个体选择 4

迭代终止 5

遗传变异 5

交叉 5

子树变异 6

Hoist变异 6

点变异 6

膨胀现象 7

节俭系数 7

模型训练 7

挖掘结果 9

因子合成 11

最大化IC_IR加权法 11

似然函数 12

顺序最小二乘规划SLSQP 13

协方差估计 13

交叉验证最优估计 14

因子合成结果 15

6总结 18

风险提示 19

图表目录

图1、交叉的方式 5

图2、子树变异的方式 6

图3、Hoist变异的方式 6

图4、点变异的方式 7

图5、框架工作流 9

图6、部分因子表达式的树状结构图 10

图7、协方差收缩方法的对比 14

图8、合成的因子回测净值 16

图9、不同合成方法比较 18

表1、模型超参数设定和说明 8

表2、适应度较高的因子的计算公式 10

表3、基础指标的定义和计算方式 11

表4、因子分组回测表现统计 17

表5、组1按年份回测统计 17

研究背景

遗传算法(GeneticAlgorithm,GA)是一种模拟生物进化过程的有哪些信誉好的足球投注网站启发式算法,它通过模拟自然选择、遗传、交叉和突变等生物学机制来优化问题解决方案。遗传算法的主要特点是直接对结构对象进行操作,不需要求导和限制函数连续性,具有内在的隐并行性和更好的全局寻优能力。它采用概率化的寻优方法,自动获取和指导优化的有哪些信誉好的足球投注网站空间,自适应地调整有哪些信誉好的足球投注网站方向。

遗传算法在量化研究中有广泛应用。主要因为它能够有效处理优化问题,尤其是在优化求解、因子挖掘、特征选择等方面。量化研究中的优化问题往往具有高维度、非线性和多峰值的特点,遗传算法通过其全局有哪些信誉好的足球投注网站能力和并行处理能力,能够有效避免陷入局部最优解,寻找全局最优或者近似最优解。

当前遗传算法在量化研究中的应用程度相当广泛。例如,它可以用于优化投资组合的权重分配,通过模拟不同资产组合的收益和风险,找到风险调整后收益最大化的组合。另外,遗传算法还可以用于量化模型的特征选择,通过遗传算法筛选出对预测模型最有贡献的特征,从而提高模型的预测准确性。再者,就是在近年来比较流行的因子挖掘框架,利用遗传算法自动挖掘有效的量化因子,提高选股模型的性能。

遗传算法的执行过程可以总结为以下步骤:

初始化种群:随机生成一组候选解作为初始种群。

评估适应度:根据适应度函数评价每个个体的性能。

选择操作:根据个体的适应度进行选择,适应度高的个体有更高的概率被选中。

交叉操作:通过交叉操作产生新的后代个体。

变异操作:以一定的概率对个体的某些基因进行变异,增加种群的多样性。

新一代种群形成:选择和交叉操作产生的新个体形成新一代种群。

终止条件判断:如果满足终止条件(如达到最大迭代次数或适应度阈值),则停止迭代,否则回到步骤3。

遗传算法的优点包括其基于群体的有哪些信誉好的足球投注网站能力、适应度函数的简单性、易于并行处理、提高有哪些信誉好的足球投注网站效率和一定的随机性。然而,它也有一些局限性,如受初始种群的影响较大、参数设置(如交叉率和变异率)依赖经验、有哪些信誉好的足球投注网站速度较慢等。

在实际应用中,可以通过编码改进、选择进化、交叉改进、自适应策略

和效率提升等方法来改进遗传算法的性能。这些改进有助于提高算法的收敛速度和解的质量。

基于遗传算法,本研究建立了一套自动化挖掘因子的框架,使其适应个股面板数据的输入。对于该模型而言,数据质量、数据输入和超参数的选择尤为重要。使用者可以个性化地修改输入的样本范围、特征变量、函数组合、模型超参数、输出数量和质量控制、适应度指标和合成方法等,灵活地适应不同的研究场合应用。该框架还具有因子检测模块,自动化输出检测报告。也可较容易地与其他模块进行组合,便于工作流进行。

遗传算法介绍

遗传规划是一种监督学习方法。它使用符号回归(SymbolicRegression)建立一连串的数学公式运算,使结果的适应度(Fitness)与衡量指标接近。具体实现方法是通过遗传算法(GeneticAlgorithm),在第一代随机生成一些候选公式,然后在每一代中,选取适应度最高的公式,通过遗传、变异、进化,不断逼近数据真实分布。

符号回归

符号回归(SymbolicRegression)是有监督机器学习方法中的一种,用于发现某种隐藏的数学表达式或函数,以最佳拟合给定的数据集。与传统的回归方法不同,符号回归通过有哪些信誉好的足球投注网站和组合基本数学运算符和函数,自动构建出一个数学表达式。同时,符号回归的可解释性较强,我们可以据此分析数据之间的计算关系。符号回归的优点在于不依赖先验知识来为非线性系统建立符号模型,而是使用遗传算法、进化策略、粒子群优化

您可能关注的文档

文档评论(0)

535600147 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:6010104234000003

1亿VIP精品文档

相关文档