网站大量收购闲置独家精品文档,联系QQ:2885784924

《金融与财务机器学习》-姜富伟习题解答.docx

《金融与财务机器学习》-姜富伟习题解答.docx

  1. 1、本文档共61页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

1

《金融与财务机器学习》复习思考题答案

第一章金融领域的机器学习

1.阐述机器学习的主要思想和步骤。

机器学习的主要思想是用先验知识设计一个合理的结构,再用实际经验对这一结构的细节进行修正和优化;其主要步骤包括数据预处理、特征提取、特征转换和预测。

2.阐述机器学习在金融领域适用的主要原因。

机器学习在金融领域适用的主要原因是金融对机器学习具有需求性,即在解决金融问题中,会遇到预测问题的高维的特性、传统金融模型的稀疏性假设等问题。而机器学习具有解决上述问题的优势:在数据高维特性的处理方面,

机器学习方法强调变量选择和降维技术减少自由度并压缩预测变量之间的冗余变化,非常适合解决高维情境下的预测问题;机器学习工具箱给我们提供了无需在预测问题上施加特殊稀疏性分析资产价格的机会,稀疏性假设问题得到很好地解决。此外,机器学习能够提供更加丰富的函数形式,适合更多金融领域的运用场景。

3.阐述机器学习在金融领域不适用的主要原因。

机器学习在金融领域不适用的主要原因是金融数据存在着“小数据性”、信噪比较低、模型稳定性较差等特点,这些特点使人们在金融领域运用机器学习到时必须经过谨慎的考虑。

2

第二章Python软件使用简介

1.Python通常如何调用第三方程序包?

Python中可使用import语句导入第三方程序包,也可使用“from….import….as语句导入第三方程序包中的部分函数。

2.Python序列包含哪些类型?

Python中序列类型包括字符、元组、列表、字典和集合。字符串用于记录文本信息以及任意字节集合,字符串使用引号来界定;元组是固定长度,不可变的Python对象序列;列表是长度可变,内容也可变的Python对象序列;字典是一系列键值对集合,键值对是两个相关联的值,可以使用键来访问相关的值;集合是无序、对象可变的Python对象序列。

3.Python常用的第三方库有哪些?

常用第三方库包括多维数组Numpy、面板处理Pandas、科学计算Sympy、统计分析Statsmodels、金融计量Linearmodes和机器学习Scikit-learn(sklearn)。

4.Python怎么处理缺失值?

面对缺失值一般处理方法可以分为:过滤缺失值、填充缺失值、不处理三种方法。Pandas中提供了dropna()和fillna()两个指令来进行数据清理,其中

dropna()用于过滤缺失值,fillna()可对缺失数据进行填充。

5.Python常用内置机器学习包有哪些?

Scikit-learn(sklearn)是机器学习中常用的第三方模块,包括回归

(Regression)、降维(DimensionalityReduction)、分类(Classfication)、聚类(Clustering)等机器方法。Python中深度学习的程序包主要包括Pytorch和Tensorflow。

3

4

第三章金融大数据的处理与分析

1.国内常用的金融数据库有哪些?

金融领域实证研究和业界处理中常用的金融数据库有国内的国泰安数据

库、万得资讯、中国研究数据服务平台以及获取国外数据的CRSP数据库。不同的数据库侧重和覆盖不同金融研究层面,且有各自的优缺点。

2.请列举几个常用描述性统计常用工具。

描述性统计常用工具包括:均值、方差、中位数、偏峰度、各类相关系数。

3.请简要阐述数据预处理的基本流程。

数据预处理的基本流程为检查缺失值并处理、异常值识别与处理、数据标准化。

4.什么是标准差法?该方法的主要用途是什么?

标准差方法也被称为“3σ”方法,在给定的样本中,那些落在样本均值的3倍标准差范围内的数据点即可被认为是异常点,我们可以定义上

(下)阈值为:threthodup(down)=x+(-)30x。其直觉来源于这样的一个统计学性质:服从正态分布的变量,其样本落在距离均值3倍标准差范围内的概率约为99%。

该方法的主要用途是设立临界值后识别样本异常值。

5.简要阐述截尾法和缩尾法的区别。

截尾方法将任何大于上阈值或任何小于下阈值的数据点从样本中删除。缩尾方法将样本中大于上阈值的数据点直接设置为上阈值,将任何小于下阈值的数据点设置为下阈值。

5

6.什么是Z值标准化(Z-Score)法?

Z-Score处理方法为将观测值减去总体均值后除以总体方差,将数据转化为均值为0方差为1的分布。其计算公式为:

Z值标准化计算简单,使得不同量级的数据便于比较,是最常用的标准化方法。

第四章因子与因子模型1.解释因子、资产价

文档评论(0)

阿弥陀佛 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档