Python金融数据分析与挖掘(微课版) 课件 第11章 行业联动与轮动分析.pptx

Python金融数据分析与挖掘(微课版) 课件 第11章 行业联动与轮动分析.pptx

  1. 1、本文档共26页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

第11章行业联动与轮动分析数据获取布尔值指标计算日行业联动与轮动关联规则挖掘

数据获取第11章以申银万国行业指数日行情数据为基础,分析行业的联动现象与轮动现象。申银万国指数行业包括:农林牧渔、采掘、化工、商业贸易、黑色金属、有色金属、纺织服装、建筑建材、电子元器件、食品饮料、公用事业、信息服务、交运设备、综合、医药生物、建筑材料、房地产、建筑装饰、电气设备、机械设备、国防军工、金融服务、家用电器、计算机、传媒、通信、信息设备、轻工制造、餐饮旅游、银行、非银金融、汽车、交通运输、机械设备等34个行业。数据区间取2010年1月4日至2017年3月7日,共1741个交易日,不足1741个交易日的行业指数剔除,最终得到28个行业指数

数据获取第11章相关数据表包括:交易日历数据表、指数基本信息表和指数交易数据表。MarkettypeClddtDaywkState12010-01-041O12010-01-052O12010-01-063O12010-01-074O12010-01-085O12010-01-111O12010-01-122O12010-01-133O……IndexcdIdxinf林牧渔801020采掘801030化工801040黑色金属801050有色金属801060建筑建材801070机械设备801080电子元器件…………指数代码交易日期收盘指数8010102010-01-042058.278010102010-01-052081.288010102010-01-062048.78010102010-01-071999.318010102010-01-082018.818010102010-01-112019.458010102010-01-122086.198010102010-01-132063.99………………

日行业联动与轮动分析(布尔值指标计算)第11章我们只关心上涨的情况,不考虑下跌的情况,因此计算每个行业从2010年1月5日至2017年3月7日的指数行情上涨情况。所谓上涨是指:当前交易日行情数据与上一个交易日行情数据的差大于零,其指标名称记为:行业名称_up,如果上涨记为1,否则记为0。计算思路及算法如下:(1)预定义空的字典D。(2)对每一个指数代码,提取其交易收盘价数据,并按日期进行排序。(3)预定义一个与其长度相等的全0数组z21_up,同时收盘价按交易日期错位相减,如果大于0,表示上涨,z21_up对应的位置赋值为1。(4)以行业名称_up为键,z21_up为值,赋值给预定义的空字典D。(5)将D转化为数据框,其中index为对应的交易日期。

日行业联动与轮动分析(布尔指标计算)第11章importnumpyasnpD=dict()fortinrange(len(code)):dt=data.loc[data[指数代码]==code[t],[交易日期,收盘价]].sort_values(交易日期)dt1=dt.iloc[0:-1,[1]][收盘价];dt2=dt.iloc[1:,[1]][收盘价];z21_up=np.zeros(len(dt2))z21_up[dt2.values-dt1.values0]=1D.setdefault(sname[code[t]]+_up,z21_up)td=pd.read_excel(交易日历数据表.xlsx)#读取交易日历数据Data=pd.DataFrame(D,index=td[‘Clddt’].values[1:])importpandasaspdcodename=pd.read_excel(指数基本信息表.xlsx)sname=pd.Series(list(codename.iloc[:,1]),index=codename.iloc[:,0])data=pd.read_excel(指数交易数据表.xlsx)code_record=data.iloc[:,0].value_counts()code=list(code_record[code_record==1741].index)

日行业联动与轮动分析(布尔值指标计算)第11章计算结果(部分)以交通运输_up这个字段为例进行说明,其中2010年1月5日、8日、11日、12日表示该行业为上涨,而2010年1月6日、7日、13日为下跌。基于该数据,我们就可以进行关联规则挖掘了。

日行业联动与轮动分析(联动规则挖掘)第11章调用apriori关联规则挖掘算法,获得行业联动关联规则挖掘结果如下表。IDrulesupp

文档评论(0)

lai + 关注
实名认证
内容提供者

精品资料

版权声明书
用户编号:7040145050000060

1亿VIP精品文档

相关文档