- 1、本文档共17页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
票价预测数据挖掘系统
基于数据仓库的数据挖掘 主要内容 数据仓库简介 实例:基于数据仓库的股市行情预报系统 一:数据仓库简介 数据仓库是面向主题的、集成的、稳定的和随时间变化的大量数据集合。 数据挖掘往往依赖于经过良好组织和预处理的数据源。 数据仓库具有从各种数据源中抽取数据, 并对数据进行清洗、聚集和转换等各种处理的能力, 这又恰好为数据挖掘提供了良好的进行前期数据准备工作的环境。 综上所述, 数据仓库和数据挖掘的结合已成为必然趋势!! 基于数据仓库的数据挖掘体系结构 数据仓库的特征: 规模大 历史数据丰富 数据集成和综合程度高 实时查询 数据仓库典型应用: 1) 面向企业决策支持系统( DSS) 在综合一体化的DSS 建设中, 基于数据仓库的数据挖掘技术将得到广泛的应用 2) 面向Internet 3) 面向图像信息系统 股市行情预报的数据仓库数据挖掘系统 本系统的功能是:在Internet 网上实现用于股市行情预报的决策支持系统(DSS)。 每日对外发布沪深两市A股、B股、基金股未来四日的股价预测及K线图。提供可以进行T+1操作(即明日最低价买,后日最高价卖)的选股名单! 本系统采用数据仓库(DW) 、数据挖掘(DM) 的联机分析(OLAP)技术,实现在浏览器端查询式的预报系统。 挖掘工具确立 数据仓库建立:数据逻辑模型 、数据物理模型 数据挖掘运算设计 挖掘工具的确立 预测方法的研究: 方法一:股价N日均线与一维平稳时间序列分析 方法二:股价波浪理论与非平稳时间序列分析 方法三:股价形态的多变性与非线性时间序列分析 方法四:股价的多因素性与线性逐次回归分析 方法五:股价的技术指标与改进型逐次回归分析 预测方法模型库的设计: 数据逻辑模型设计 数据时间粒度:股票日行情 数据空间粒度:四层空间结构 从本系统的主题出发,客户对象是广大股民,他们更关心微观信息。因此将数据空间颗粒度确立在第三层。 行情维:P={开盘价,最高价,最低价,收盘价,成交量,成交额}的数据集。 股票维:S={s1,s2,s3, …},如:深发展,深万科, …等数据集。 时间维:T={t1,t2,t3, …},如:当日,上一日,上二日, …等数据集。 数据模型: V={S,P,T} 三维星型时空结构 数据物理模型 数据仓库功能组织模块: 数据提取模块 数据清洗模块 数据转换模块 除权派息模块 数据挖掘运算设计 挖掘过程: 1)据预测方法代码从预测模型库中调出运算方法程序。 2)根据股票代码连接对应数据仓库,从中取出相应的数据切片或切块。 3)执行运算。建立预测模型,再由模型计算出预测值。 我们设计对于浏览器的每一个请求,同时算出PO,PH,PL,PC四个未来四日的预测结果。用于绘制K线图。 本系统的预报周期是以日为单位,每日在证券交易所收市之后,开始更新数据仓库。经过数据挖掘运算,即可在网上预报。 经测试预测相对误差不大于1%占70%左右,预测相对误差不大于2%占90%左右,这对定量预测来讲效果令人满意! * * * *
文档评论(0)