- 1、本文档共32页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
4
生态环境大数据数据字典技术规范
1范围
本文件规定了生态环境大数据数据字典的编制原则、内容组成、内容属性、文档编制要求。
本文件适用于生态环境大数据数据字典构建。
2规范性引用文件
下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,仅该日期对应的版本适用于本文件;不注日期的引用文件,其必威体育精装版版本(包括所有的修改单)适用于本文件。
GB/T8567HJ/T419HJ723
计算机软件文档编制规范
环境数据库设计与运行管理规范环境信息数据字典规范
3术语和定义
下列术语和定义适用于本文件。
3.1
数据项dataitem
数据字典中具有独立含义的最小数据单位。
3.2
实体entity
具体或抽象的事物及其关系。事物可以是人、物体、事件、观念、信息、过程等,实体的存在不依赖于是否有关于它的数据。
3.3
生态环境大数据数据字典datadictionaryofecologicalandenvironmentalbigdata
环境信息数据体系结构的描述信息的集合,记录了数据库的组成和格式等信息。环境信息数据字典属于环境信息元数据范畴,由实体和数据元组成。
3.4
统一资源标识符uniformresourceidentifier,URI
统一资源标识符是一个用于标识某一互联网资源名称的字符串。该种标识允许用户对任何(包括本地和互联网)的资源通过特定的协议进行交互操作。URI由包括确定语法和相关协议的方案所定义。URI的标准格式为:
[协议名]://[用户名]:[密码]@[服务器地址]:[服务器端口号]/[路径]?[查询字符串]#[片段ID]
5
4编制原则
生态环境大数据数据字典编制应遵循以下原则:
a)参考并兼容现有标准,制定有依据。在数据字典编制过程中,数据项的定义需遵守国家和环境行业数据元、数据字典、数据分类、数据编码等相关数据标准;
b)结合实际,服务实践,简洁实用。数据字典的编制应站在指导系统开发和维护、促进数据交换共享的角度进行编制,内容应实用、简洁、准确;
c)及时更新,保证一致。若系统需求和设计发生变更,应及时更新数据字典,保证数据字典和系统最终实现的一致性;
d)开放兼容,易于扩展。遵照先标准后定义的数据字典建设规范,保证数据定义标准化。
5内容组成
5.1字典管理实体
环境信息数据字典管理实体应符合HJ723的相关要求,补充最后修改人、最后修改人所属单位、内容描述等数据元。
5.2数据库信息实体
数据库信息实体由数据源、端口、用户名、密码、编码方式、数据库名称、数据库描述、数据库管理系统类型代码、数据库管理系统版本、监管机构、应用系统名称、开发单位、建设单位、管理维护单位、维护联系人、维护联系电话、维护联系Email、维护联系地址及邮编、更新单位、更新日期等数据元组成,其中数据库管理系统类型代码见表1。
表1数据库管理系统类型代码
代码
数据库管理系统
备注
01
Oracle
类型代码的80-99段属于可扩展部分。
02
MicrosoftSQLServer
03
DB2
04
Sybase
05
MySQL
06
Inform
07
KingBase
08
OpenBase
09
openGauss
10
OceanBase
11
达梦
12
TiDB
……
6
99
5.3其他关系数据库有关实体
环境信息数据表实体、数据项(字段)信息实体、视图信息实体、存储过程信息实体的数据元组成应符合HJ723的相关要求。
5.4非结构化与半结构化数据实体
在环境大数据中,非结构化与半结构化数据根据数据实体的应用场景不同采取不同的存储方式,对于以文件方式存储的数据实体,由数据源、端口、用户名、密码、目录、文件名、文件格式、编码格式代码、数据描述等数据元组成;对于以对象方式存储的数据实体,由数据源、端口、用户名、密码、对象标识、对象内部属性元数据、数据描述等数据元组成。数据库编码格式代码见表2。
表2文件编码格式代码
代码
编码名称
备注
01
ASCII
美国标准信息交换码(ASCII):7位二进制编码,能够表示128个字符。
02
Unicode
Unicode编码:16位二进制编码,能够表示65536个字符,包括世界上所有的语言字符。
03
UTF-8
UTF-8编码:基于Unicode编码,采用可变长度的编码方式。
04
UTF-16
UTF-16编码:基于Unicode编码,采用16位或32位编码方式。
05
GBK
GBK编码:是一种汉字编码方式,能够表示210
文档评论(0)