- 1、本文档共22页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
汇添富基金 吴振翔
量化投资与机器学习
2018.5.6
0. 量化投资需要什么技术?
量化投资与机器学习,问题的定义是什么?
需要先定义量化投资,进而才能思考机器学习技术在其中的应用。
我们如何看待量化投资
2018-10-29
汇添富基金
量化投资的应用场景
2018-10-29
汇添富基金
量化投资需要解决的问题
2018-10-29
汇添富基金
传统量化投资技术
2018-10-29
汇添富基金
量化投资需要什么技术?
2018-10-29
汇添富基金
1. 我们感兴趣的机器学习技术
机器学习技术发展日新月异,但在狭义的量化投资领域的应用才刚刚开始。
数据获取与数据处理
2018-10-29
汇添富基金
Source: Big Data and AI Strategies: Machine Learning and Alternative Data Approach to Investing, J.P.Morgan
从海外经验来看,投资领域对于另类数据的使用已经起步,数据使用范围可谓相当多样。
从数据获取来看,主要来源如下:舆情文本、卫星图像、交通信息、物流信息、网络有哪些信誉好的足球投注网站、电商信息等。
对应于这些数据来源,所需要的数据处理技术包括:自然语言处理、计算机视觉等。
自然语言处理技术
2018-10-29
汇添富基金
从数据处理和特征提取角度来看,目前自然语言处理技术已经较为成熟,可以对诸如新闻、公告等文本信息进行大规模处理。
中文分词技术是处理中文文本数据的基础;词向量技术是将高维且正交的one-hot向量,转变为低维且具有几何意义的向量的技术。
自然语言处理技术
2018-10-29
汇添富基金
海外某公司现在已经开始提供实时的Twitter舆情数据,直观来看,Tweet Volume和Sentiment都没有很强的领先性,但也不排除精细化处理后对投资能够起到作用。
Source: /charts/#charts-10
计算机视觉技术
2018-10-29
汇添富基金
卷积神经网络(CNN)为处理具有空间结构的数据提供了极大可能。
GPU硬件技术的突飞猛进大大提升了CNN的数据处理能力,使得工业界目前已经可以处理大规模的图像和视频数据。
计算机视觉技术
2018-10-29
汇添富基金
海外某公司通过计算机视觉技术,识别卫星图像等原始图像当中的停车场停车数量信息,进而构建零售、餐饮、酒店等场景的高频经营数据。通过这些高频经营数据可以构建相应的交易信号。
该公司提供了一种交易方法:计算每月的停车量同比增速,季度计算累计同比增速,计算过去6个月同比增速的布林带,当季度累计同比增速穿越布林带上下轨时,触发买入卖出交易。
Source: Big Data and AI Strategies: Machine Learning and Alternative Data Approach to Investing, J.P.Morgan
机器学习模型
2018-10-29
汇添富基金
通过对大量非结构化的数据进行处理,成为数字化、向量化的数据集,进而通过机器学习算法进行建模和训练,是目前机器学习领域的主要方法论。
工业界的机器学习模型主要解决以下问题:
分类(classification)
回归/预测(regression)
其他,如生成模型,强化学习模型等
机器学习模型的表述能力
2018-10-29
汇添富基金
以深度神经网络模型为例,早在1993年,就有学术研究从数学上证明:多层神经网络+非线性激励函数可以近似任何函数。
近期实证研究表明,随着神经网络层数的增加,测试集的准确度逐渐提升;此外,在不增加神经网络层数,仅仅增加参数个数的情况下,模型的效果提升不明显;而在不改变参数个数的情况下,将层数从3层增加至11层,则可以显著提升模型效果。
Source: Goodfellow, I. J., Bengio, Y., Courville, A. (2017). Deep Learning
2. 量化投资与机器学习
我们的实践以及思考
存在的障碍
2018-10-29
汇添富基金
存在的障碍
2018-10-29
汇添富基金
将量化投资和机器学习相提并论是不适合的……
机器学习,从入门到放弃?
2018-10-29
汇添富基金
数据少,噪声大,投入还小,只能做toy model?
我们对股票市场有独到的理解!不需要大量数据和大量投入就能搞出好模型!
相比于现有的量化模型,机器学习的模型和方法能够更好克服人为观测的偏差,如:
市值因子为什么是市值取对数?
反转因子为什么是区间收益率?
风险为什么可以用标准差表示?
现有量化投资的模型都是基于简单的人为观测逻辑,进行历史检验,获得较好效果之后进行使用的。
而机器学习方法论是:对更为广
您可能关注的文档
- 《护理评估—乳房评估心得》.ppt
- 《华轮椅上的霍金》.ppt
- 《黄金比课件》.ppt
- 《黄金策及白话注解》.doc
- 《黄金策总断千金赋(完整)》.doc
- 《黄金分割.》.ppt
- 《黄金分割(公开课)》.ppt
- 《护理课件-脊髓空洞症护理查房》.ppt
- 《黄金分割初中数学课件》.ppt
- 《黄金分割比的应用》.ppt
- 2024年江西省寻乌县九上数学开学复习检测模拟试题【含答案】.doc
- 2024年江西省省宜春市袁州区数学九上开学学业水平测试模拟试题【含答案】.doc
- 《GB/T 44275.2-2024工业自动化系统与集成 开放技术字典及其在主数据中的应用 第2部分:术语》.pdf
- 中国国家标准 GB/T 44275.2-2024工业自动化系统与集成 开放技术字典及其在主数据中的应用 第2部分:术语.pdf
- GB/T 44285.1-2024卡及身份识别安全设备 通过移动设备进行身份管理的构件 第1部分:移动电子身份系统的通用系统架构.pdf
- 《GB/T 44285.1-2024卡及身份识别安全设备 通过移动设备进行身份管理的构件 第1部分:移动电子身份系统的通用系统架构》.pdf
- 中国国家标准 GB/T 44285.1-2024卡及身份识别安全设备 通过移动设备进行身份管理的构件 第1部分:移动电子身份系统的通用系统架构.pdf
- GB/T 44275.11-2024工业自动化系统与集成 开放技术字典及其在主数据中的应用 第11部分:术语制定指南.pdf
- 中国国家标准 GB/T 44275.11-2024工业自动化系统与集成 开放技术字典及其在主数据中的应用 第11部分:术语制定指南.pdf
- 《GB/T 44275.11-2024工业自动化系统与集成 开放技术字典及其在主数据中的应用 第11部分:术语制定指南》.pdf
最近下载
- 犬猫常见药物分类及汇总.doc VIP
- 螺丝产品生产流程.ppt
- (人教版)数学三年级上册计算题“天天练”习题卡,含100份题组,附参考答案.doc
- 小学一年级家长会语文老师PPT课件1_图文.ppt
- 奥鹏云南开放大学 小学语文案例教学(20秋)形考作业4(客观).doc VIP
- 沅陵大曲酒厂续建项目(重大变更) 环境影响报告书.pdf
- SH∕T 1541.1-2019 塑料颗粒外观试验方法 第1部分:目测法.pdf
- 泳池清洁机器人.pdf VIP
- 中职高考语文二轮复习写作技巧专项突破专题01 应用文写作-技巧与练习(含详解).docx VIP
- 【新教材】人教PEP版(2024)三年级上册英语Unit 1 Making friends单元整体教学设计.docx
文档评论(0)