- 1、本文档共26页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
北京市国产轻型轿车车载诊断系统(OBD)数据分析
北京市国产轻型轿车车载诊断系统(OBD )数据分析
—基于数据挖掘的 OBD 参数研究
云南师范大学 黄琼华、王敏、王璐
目录
摘要:4
一、问题的提出及研究思路 5
(一)问题的提出 5
(二)研究思路 5
二、建模准备 6
(一)数据来源 6
(二)数据分析与预处理 6
(三)模型假设 7
(四)变量选择 7
三、模型构建 7
(一)聚类分析 7
(二)主成分分析 7
(三)多元线性回归 8
(四)机器学习方法 8
1.决策树8
2.SVM 法8
3.BOOSTING 回归8
4.随机森林回归9
四、数据挖掘技术 9
(一)理论准备 9
1. K 均值聚类法9
2.主成分分析9
1
3.现代分类和回归:机器学习算法的基本思想11
4. 多元线性回归11
(1).模型定义11
(二)聚类分析 12
1.基于主成分分析的分层聚类12
2.K-MEANS 聚类16
(三)主成分分析 17
(四)现代分类和回归:机器学习方法 20
1.决策树回归:回归树20
2.BOOSTING 回归21
3.支持向量机(SVM )22
4.随机森林22
5.交叉验证比较各个模型22
(五)多元线性模型 23
五、主要结论和不足之处 24
六、政策建议 25
七、附录 25
八、参考文献 26
2
表格和插图清单
表 1 车辆编码 p6
表 2 10 折交叉验证训练集的 NMSE p23
表 3 即时参数数据 p25
表 4 综合参数数据 p26
图 1 综合参数分层聚类 1 p13
图2 综合参数分层聚类 2 p13
图 3 综合参数分层聚类 3 p14
图4 即时参数分层聚类 1 p14
图 5 即时参数分层聚类 2 p15
图6 即时参数分层聚类 3 p15
图 7 综合参数的 K-Means 聚类 p16
图8 即时参数的K-Means 聚类 p17
图9 即时参数主成分分析的崖底碎石图(贡献率,左)和图 10 累计贡献率(右) p18
图 11 即时参数主成分分析的载荷图 p19
图 12 综合参数主成分分析的崖底碎石图 (贡献率,左)和图 13 累计贡献率图(右)p19
图 14 综合参数的主成分得分图 p20
图 15 决策树 p21
图 16 变量重要性图 p22
图 17 拟合值与残差图 p24
3
摘要
OBD (On-Board Diagnostics:车载诊断系统)是一种装置于车中用以监控
车辆污染的系统,可于车辆的排放控制元件出现问题时,早期产生讯号以通知车
主送店维修,避免问题车辆在不知情的情况下制造更多的污染和长期磨损对汽车
造成伤害。OBD 技术还应用于汽车排污预测与防污措施建议等方面。由于OBD 诊
断数据专业性强且繁多,如何将指标简化易懂,有选择性的呈现给车主是个比较
关键的问题。为找出这些指标,我们通过基于数据挖掘分析,对 OBD 数据集数据
进行预处理,用聚类分析,主成分分析和因子分析将数据分类并筛选出比较重要
的指标,然后用随机森林做预测模型,选取重要
文档评论(0)