ICS35.020
CCSL70
中华人民共和国国家标准
GB/T46207—2025
科学数据标识编码规范
Codingspecificationforscientificdataidentification
2025-10-05发布 2026-02-01实施
国家市场监督管理总局
国家标准化管理委员会发布目 次
前言 Ⅲ …………………………………………………………………………………………………………
引言 Ⅳ …………………………………………………………………………………………………………
1 范围 1 ………………………………………………………………………………………………………
2 规范性引用文件 1 …………………………………………………………………………………………
3 术语和定义 1 ………………………………………………………………………………………………
4 科学数据标识编码原则 1 …………………………………………………………………………………
5 科学数据标识编码结构 1 …………………………………………………………………………………
6 科学数据标识编码要素 2 …………………………………………………………………………………
7 科学数据标识编码方案 3 …………………………………………………………………………………
8 应用要求 4 …………………………………………………………………………………………………
附录A(资料性) 科学数据标识编码应用 5 ………………………………………………………………
参考文献 6 ………………………………………………………………………………………………………
ⅠGB/T46207—2025
前 言
本文件按照GB/T1.1—2020《标准化工作导则 第1部分:标准化文件的结构和起草规则》的规定
起草。
请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。
本文件由中华人民共和国科学技术部提出。
本文件由全国科技平台标准化技术委员会(SAC/TC486)归口。
本文件起草单位:中国科学院计算机网络信息中心、国家科技基础条件平台中心、中国科学院国家
空间科学中心、中国计量科学研究院、中国标准化研究院、中国科学技术信息研究所、中国物品编码中
心、北京航空航天大学、北京大学、中国科学院青藏高原研究所、中国地质大学(北京)、中国极地研究中
心(中国极地研究所)、中国科学院西北生态环境资源研究院、中国科学院微生物研究所、中国科学院地
理科学与资源研究所、农业农村部南京农业机械化研究所、中国农业科学院农业信息研究所、中国科学
院空天信息创新研究院、中国医学科学院医学信息研究所、中国科学院高能物理研究所、中国科学院国
家天文台、中国林业科学研究院资源信息研究所、中国地震台网中心、国家海洋信息中心、国家气象信息
中心(中国气象局气象数据中心)、北京科技大学、中国科学院北京基因组研究所(国家生物信息中心)、
中国科学院深圳先进技术研究院、广州国家实验室。
本文件主要起草人:周园春、刘佳、石蕾、王姝、邹自明、刘子龙、王志强、王丽娟、刘华、许琦、刘伟、
李素彩、夏晓蕾、张辉、蔡华谦、胡良霖、李新、王佩、胡晓彦、何明跃、王学志、吴立宗、张耀南、陈昕、马俊才、
王卷乐、李成赞、何洪林、周国民、王健、李国庆、吕雪峰、钱庆、陈刚、崔辰州、纪平、杨天青、姜晓轶、张强、
李晓刚、鲍一明、李烨、肖庆宇。
ⅢGB/T46207—2025
引 言
GB/T32843—2016《科技资源标识》自2017年9月实施以来受到了广泛关注,其规定了科技资源
标识的对象和产生途径、标识的结构与编写规则,但具体资源类型的编码原则、编码结构、编码方案、应
用要求及示例并未进行规范说明,为了推动科学数据的统一登记、定位和共享,充分结合当前实际应用
需求,本文件将针对科技资源标识中类型代码为“11”的科学数据内部标识符进行细化和规范。
ⅣGB/T46207—2025
科学数据标识编码规范
1 范围
本文件规定了科学数据标识的编码结构、编码要素、编码方案和应用要求。
本文件适用于科学数据的登记、检索、定位、利用和开放共享。
2 规范性引用文件
下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文
件,仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于
本文件。
GB/T32843—2016科技资源标识
3 术语和定义
下列术语和定义适用于本文件
3.1
科技资源 scienceandtechnologyresource
支撑科技创新和经济社会发展的科技基础条件资源、技术创新资源等。
[来源:GB/T32843—2016,2.1]
3.2
科学数据 scientificdata
在自然科学、工程技术科学等领域,科学研究活动中形成的以及通过观测监测、考察调查、检验检测
等方式获取的原始及其衍生信息的记录,或可用于科学研究活动的其他数据。
[来源:GB/T43708—2025,3.1]
3.3
科学数据标识编码 scientificdataidentificationcoding
用于识别和定位科学数据的一组由数字、字母、符号构成的字符序列。
4 科学数据标识编码原则
科学数据标识编码原则如下:
a) 唯一性:科学数据标识编码唯一对应一个科学数据集、数据文件或单条数据;
b) 持久性:科学数据标识编码一经注册,不宜修改或删除;
c) 兼容性:科学数据标识编码考虑实际使用需求,支持兼容已有标识编码体系;
d) 扩展性:科学数据标识编码支持层级和容量的扩展及灵活扩充和调整。
5 科学数据标识编码结构
科学数据标识编码应按GB/T32843—2016的编码结构设计,由中国科技资源代号(Scienceand
1GB/T46207—2025
technologyresourceidentification,CSTR)全称、科技资源标识注册机构代码、科技资源类型代码和内
部标识符4部分组成,如图1所示。其中科技资源类型代码为11代表科学数据,总长度不超过255
字节。
CSTR:
中国科技资源代号(4位字母)×××××.
科技资源标识注册机构代码(5位)11.
科技资源类型代码(2位数字码)×××.×××...×××
内部标识符(不定长)
图1 科学数据标识编码结构
6 科学数据标识编码要素
科学数据标识编码应由多段编码要素组成,包括但不限于中国科技资源代号、科技资源标识注册机
构代码、科技资源类型代码、科学数据名称、数据粒度类型、日期、科技项目类型、科技项目编码、序列号、
版本号和内部编码等,具体见表1,可根据实际应用需求选择合适的编码要素,形成编码方案。
表1 科学数据标识编码要素
要素名称 要素说明 代码字符类型可选性长度 示例
中国科技资源
代号我国所有科技资源的统一代号,采用
中国科技资源的英文缩写“CSTR”
表示字母型 必选项 4 CSTR
科技资源标识注册
机构代码科技资源标识注册机构的唯一标识
代码字母数字型必选项 5 35645
科技资源
类型代码按科技资源的表现形式分类标识,科
学数据类型代码为11数字型 必选项 2 11
科学数据名称科学数据基本内容的名称 字母数字型可选项不定长 macro
数据粒度类型科学数据颗粒度类型,包括但不限于
数据集、数据文件和单条数据等字母数字型可选项不定长 ds、df、sd
日期科学数据注册日期,采用年月日
YYYYMMDD的表示形式数字型 必选项 8 20230815
科技项目类型科学数据所属科技项目类型 字母数字型可选项不定长NSFC、NSTMP、
NKRDP
科技项目编码科学数据所属科技项目编码 字母数字型可选项不定长 11374198
序列号 科学数据的顺序号 数字型 必选项不定长 270961
版本号 科学数据版本的标识号 字母数字型可选项 3 V01
内部编码 在内部系统中使用的已有编码 字母数字型可选项不定长NMDCX0001325
2GB/T46207—2025
GB-T 46207-2025 科学数据标识编码规范
文档预览
中文文档
15 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2025-12-16 08:50:27上传分享