科学数据分类与编码标准讲义.ppt

  1. 1、本文档共38页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
* 科学数据分类编码工具软件 * 电子词典软件框架 * 电子词典功能 标准的管理和维护 查询 以类名查询,以代码查询,以释义查询; 精确查询,模糊查询。 标引 映射 * 标引——保证标准和数据之间的关系 SDCC 数 据 集 A 标引数据库 用户1 用户2 检索1 检索2 得到数据集A 标引 系统轮排 从外部进行标引, 数据集本身无需任何变动 * 关键技术(1) 高效的信息管理和查询 灵活地管理机制,可实现多层次的分类树的高效存储; 实现了类目和代码的双向查询采用了高效的算法,可以支持10万级别以上,乃至100万级别的类目的快速查询; 可快速提取分类树的信息及标引结果集信息。 * 关键技术(2) 数据的标引 电子词典及辅助编码器使得用户对数据的分类可以不再依赖于文件系统,可以在后台数据库的支持下直接完成,最后打包提交即可。 * 演示 * Thank you! * * 科学数据分类与编码标准 * 主要内容 编制背景 标准总体结构 标准内容要点解析 标准使用 * 简介 * 科学数据分类与编码方案 1 范围 2 规范性引用文件 3 术语和定义 4 分类原则 5 分类方法 6 编码规则 7 分类与编码的使用 8 分类代码表 * 分类类目释义 6大门类、31亚门类、234大类和1008中类,共1279条类目的释义 * 电子词典 主要功能 分类类目的管理 分类类目的查询 数据集标引 分类映射 … … * 转换实例——mapping机制 分别对每个试点的分类作相应的Crosswalk,实现标准之间的映射; 试点已有的标引结果可以通过软件直接映射。 * 一、编制背景 * 背景 海量科学数据的共享需求 海量科学数据需要有序组织、管理 科学数据共享工程门户网站需要按照分类来组织数据目录 数据用户需要从分类编码中查询数据 * 解决的问题 多学科、跨行业部门科学数据的分类 分类编码如何应用 如何支持网络信息化的数据集分类和共享 与已有科学数据共享工程中诸多试点的分类标准之间如何交互 * 二、标准总体结构 * 标准目次 1 范围 2 规范性引用文件 3 术语和定义 4 分类原则 5 分类方法 6 编码规则 7 分类编码的使用 8 分类代码表 附录A 资料性附录 科学数据共享工程分类编码标准的使用实例 附录B 资料性附录 本标准与科学数据共享工程中试点单位的分类标准之间的映射 附录C 资料性附录 科学数据共享工程数据分类编码标准XML文件 * 门类 门类 代码 基础科学 F 资源环境科学 R 农业科学 A 工程技术科学 T 医药卫生科学 H 区域与综合领域 C * 亚门类(资源环境科学为例) 资源环境 亚门类 代码 气象气候 W 水文水资源 H 海洋 S 地矿与土地资源科学 L … … … … * 大类 门类 亚门类 大类 代码 资源环境科学 海洋科学 海洋资源 11 海洋经济 12 海洋环境 13 海洋生态 14 海洋灾害 15 …… …… * 中类 门类 亚门类 大类 中类 代码 总代码 资源环境科学 海洋科学 海洋资源 海洋自然资源 11 RS1111 海洋生物资源 12 RS1112 大洋矿产资源 13 RS1113 海水化学资源 14 RS1114 …… …… …… * 编码规则 门类、亚门类各为1位英文字母码,大类、中类各2位数字码。采用线分类按门类、亚门类、大类、中类的从属关系顺序编码。 第1位 第2位 第3位 第4位 第5位 第6位 门类 亚门类 大类 中类 字母码 字母码 数字码 数字码 * 三、标准内容要点解析 * 分类依据(1) 遵循“数据分类与编码基本原则与方法”标准 数据分类的基本单元(或者说分类的对象)是数据集 保证高层数据分类统一,低层数据分类由各单位自行研制 以数据中心有效管理、组织数据,最终用户快捷地查找数据为目的 * 分类依据(2) 以科学数据共享工程的规划为依托 充分考虑各个数据共享中心的分类编码 结合学科分类标准、行业分类标准 * 分类编码标准的应用 该标准只适用于数据集的分类,并将分类结果组织形成数据目录。该标准不适用于数据库的改造,数据项的改造,数据项内容的代码填写等。 * 分类编码标准的维护 随着科学数据共享工程的不断推进,该分类编码标准必定会不断扩展和修订。 这种扩展必须是在遵从“数据分类与编码基本原则与方法”的基础上的扩充。 * 数据集的分类标引 分类标引的对象是数据集 分类标引是在数据集外部进行的 分类标引的最终结果是标引结果集(数据库) * 标引过程中组配方法的应用 在分类标引时,针对数据集的内容,从类目中找出与数据集内容相对应的各个类目,用它们的编码组配表达所标引的数据集内容。 * 标准的映射及标引结果集的转换 把各个数据中心采用的分类

您可能关注的文档

文档评论(0)

benzei244572 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档