- 1、本文档共7页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
第7章基础案例问题描述数据预处理关联规则挖掘
问题描述第7章为了探讨国际上主要股票价格指数之间的涨跌关联情况,选取12个主要国家或者地区中具有代表性的股票价格指数交易数据,数据表包括国际股票价格指数基本信息表和国际股票价格指数日交易数据表。IndexcdIdxnmeDJI美国道琼斯工业指数FCHI法国CAC40指数FTSE英国富时100指数GDAXI德国DAX指数HSI中国香港恒生指数KS11韩国KOSPI指数MCIX俄罗斯Micex指数N225日本日经225SENSEX印度孟买30指数STI富时新加坡海峡时报指数TWII中国台湾加权指数000300中国沪深300指数IndexcdTrddtOpnidxHighidxLowidxClsidxDJI2010-01-0410430.6910604.9710430.6910583.96DJI2010-01-0510584.5610584.5610522.5210572.02DJI2010-01-0610564.7210594.9910546.5510573.68DJI2010-01-0710571.1110612.3710505.2110606.86DJI2010-01-0810606.410619.410554.3310618.19DJI2010-01-1110620.3110676.2310591.5910663.99DJI2010-01-1210662.8610663.0810568.8410627.26………………其中字段依次为指数代码、交易日期、开盘指数、最高指数、最低指数、收盘指数。数据区间从2010年1月至2019年8月。问题:在一国或地区由于受某事件的影响造成其主要股票价格指数下跌幅度较大时,另一国或地区的主要股票价格指数在同期是否也会有较大幅度的下跌?注意,这里下跌幅度较大定义为:跌幅大于等于0.5%。
数据预处理第7章(1)计算各指数的跌幅指标数据,其中跌幅计算公式为:(当日收盘指数?上日收盘指数)/上日收盘指数为了便于关联规则挖掘,我们将跌幅指标数据转化为0、1布尔值,即跌幅大于等于0.5%记为1,否则为0。图中第一行代表了中国沪深300指数的跌幅数据,其中2010年1月5日的值为0,表示跌幅没有超过0.5%,而2010年1月6日的值为1,表示当日跌幅超过了0.5%。
数据预处理第7章(2)各指数交易日期做一致化处理。事实上,不同国家或地区的交易日期并不完全相同,为了便于挖掘有意义的关联规则,需要在所有指数交易日均相同的情况下进行挖掘。这里以中国沪深300指数交易日为筛选基准。显示12个国际指数,2010年1月至2019年8月的共同交易日一共1569个,基于一致化的交易日期,就可以构造关联规则挖掘所需的布尔数据集了。
数据预处理第7章(3)构造关联规则挖掘所需的布尔值数据集,其结果如下。道琼斯工业指数DJI在2010年1月15日的收盘指数跌幅在0.5%以上,中国沪深300指数当日的收盘指数跌幅低于0.5%,而且12个国际指数交易日期也做了一致化处理,下面将基于该数据集挖掘关联规则。
关联规则挖掘第7章采用第5章介绍的一对一关联规则挖掘算法,最小支持度设置为大于0.1,最小置信度为大于0.6。c=list(Data.columns)c0=0.6#最小置信度s0=0.1#最小支持度list1=[]#预定义定义列表list1,用于存放规则list2=[]#预定义定义列表list2,用于存放规则的支持度list3=[]#预定义定义列表list3,用于存放规则的置信度forkinrange(len(c)):forqinrange(len(c)):#对第c[k]个项与第c[q]个项挖掘关联规则#规则的前件为c[k]#规则的后件为c[q]#要求前件和后件不相等ifc[k]!=c[q]:c1=Data[c[k]]c2=Data[c[q]]I1=c1.values==1I2=c2.values==1t12=np.zeros((len(c1)))t1=np.zeros((len(c1)))t12[I1I2]=1t1[I1]=1sp=sum(t12)/len(c1)#支持度co=sum(t12)/sum(t1)#置信度
您可能关注的文档
- Python金融数据分析与挖掘(微课版) 课件 1-1. Python基本数据类型与基本数据结构.pptx
- Python金融数据分析与挖掘(微课版) 课件 1-2. Python公有方法.pptx
- Python金融数据分析与挖掘(微课版) 课件 1-3. Python基本数据结构方法.pptx
- Python金融数据分析与挖掘(微课版) 课件 2-1. 数组创建与操作.pptx
- Python金融数据分析与挖掘(微课版) 课件 2-2. 矩阵与线性代数运算.pptx
- Python金融数据分析与挖掘(微课版) 课件 3-1.序列.pptx
- Python金融数据分析与挖掘(微课版) 课件 3-2.数据框.pptx
- Python金融数据分析与挖掘(微课版) 课件 3-3.外部文件读取.pptx
- Python金融数据分析与挖掘(微课版) 课件 3-4.常用函数.pptx
- Python金融数据分析与挖掘(微课版) 课件 3-5.常用计算任务.pptx
最近下载
- JTTW-WL-MR-EM-019迈为自动化设备维护保养手册-迈为.pdf
- PANTONE国际色卡CMYK色值对照表.docx
- 鼎和财险电化学储能系统责任保险条款.docx VIP
- 基于PMAC的双转台五轴数控机床几何误差研究.pdf VIP
- XX街道加强物业管理工作经验材料.docx
- 湘科版五年级科学实验报告单.doc
- 广东省广州市海珠区2021-2022学年七年级上学期期末生物试题(解析版).docx VIP
- 【超市营业员】胖东来果蔬课一线岗位实操标准与流程!.doc VIP
- 《混凝土结构》课程设计--现浇钢筋混凝土整体式肋梁楼盖结构.pdf
- 人教版(2024)英语七年级上册全册教案.DOCX VIP
文档评论(0)