- 1、本文档共6页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
1
机车车辆计量结果数字化处理规范
1范围
本文件确立了机车车辆计量结果数字化处理流程,规定了数据采集、数据预处理、数据存储、数据分析、数据可视化等要求。
本文件适用于机车车辆计量结果数字化处理。
2规范性引用文件
下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,仅该日期对应的版本适用于本文件;不注日期的引用文件,其必威体育精装版版本(包括所有的修改单)适用于本文件。
GB/T5271.1信息技术词汇第1部分:基本术语DA/T31纸质档案数字化规范
JJF1001通用计量术语及定义
DB43/TXXXX机车车辆计量数据管理规范
3术语和定义
GB/T5271.1、DA/T31、JJF1001界定的以及下列术语和定义适用于本文件。3.1
数字化digitization
用计算机技术将模拟信号转换为数字信号的处理过程。
[来源:DA/T31-2017,3.1]3.2
数据date
信息的可再解释的形式化表示,以适用于通信﹑解释或处理。注:可以通过人工或自动手段处理数据。
[来源:GB/T5271.1-2000,01.01.02]
4数字化处理流程
机车车辆计量结果数字化处理流程见图A.1。
5数据采集
5.1数据采集前,应确认测量仪器处于校准状态,并记录相应的校准结果。
5.2按安装流程安装测量仪器,进行多次测量确保数据稳定性,并应记录测量时间、地点以及测量参数。
2
5.3应对采集的数据进行初步检查,检查数据是否存在缺失值、异常值,并记录数据检查结果。
6数据预处理
6.1异常值宜采用删除、替换、离群值检测等方法处理,其中离群值检测宜采用箱线图、聚类等统计方法处理,数据单位应采用国际基本单位或其组合。
6.2重复值宜采用删除、合并、标记等方法处理,其中合并可采用相似度匹配、聚类等方法处理。
6.3缺失值宜采用填充缺失值、删除缺失值或进行插值处理,插值可采用线性插值、多项式插值、样条插值、最近邻插值等方法进行处理。
6.4不一致值宜采用规范化、转换、匹配等方法处理,其中规范化可采用大小写转换、数据类型转换等方法处理。
6.5格式不一致宜采用规范化、转换、格式化等方法处理,其中规范化可采用格式化字符串、正则表达式等方法处理。
6.6应进行数据完整性检查。
7数据存储
7.1数据存储应由数据库选择与匹配、数据库连接、数据导入三部分构成,数据库选择与匹配应符合DB43/TXXXX(机车车辆计量数据管理规范)。
7.2数据库连接应提供常用的数据开放互连接口,并应对数据库连接的稳定性进行测试。
7.3应将数据预处理得到的数据导入数据库中。
8数据分析
8.1应对数据进行筛选,选择需要分析的数据。
8.2连续信号和随机信号宜使用统计特征分析,连续信号还宜使用频域特征、时域特征等信号处理方法。
8.3多源高维的数据挖掘中宜采用下列方法:
a)假设检验:用于检验数据之间是否有显著差异,判断是否拒绝某个假设;
b)回归分析:用于分析自变量和因变量之间的关系,建立回归模型,预测因变量的变化趋势;
c)聚类分析:将数据分成若干类别,同一类别内的数据相似度较高,不同类别之间的数据相似度较低;
d)主成分分析:将多个变量合并成少数几个新变量,保留原始变量的大部分信息,以减少维度;
e)时间序列分析:用于分析时间序列数据,找出趋势、季节性和周期性等规律,预测未来的变化趋势;
f)关联规则挖掘:从数据中发现频繁出现的模式和关联关系;
g)决策树分析:基于样本数据建立决策树模型,通过选择属性值,逐步筛选出目标属性预测值;
h)神经网络分析:用人工神经网络模拟人脑处理信息的过程,进行数据建模和预测等操作。
9数据可视化
3
9.1机车车辆计量结果数据可视化应根据数据特点和分析需求,合理选择可视化工具。
9.2应选择直观的、易于理解的方式,将数据蕴含的信息进行可视化展示,宜使用的数据图表包括但不限于折线图、柱状图、饼状图等,图表应包含必要的说明注释。
9.3应能生成可视化图表文件并保存。
1
附录A(资料性)
机车车辆计量结果数字化处理流程
图A.1给出了机车车辆计量结果数字化处理流程。
图A.1机车车辆计量结果数字化处理流程
文档评论(0)