说明:收录25万 73个行业的国家标准 支持批量下载
书 书 书犐犆犛 35 . 240 . 70 犔 70 /G21 /G22 /G23 /G24 /G25 /G26 /G27 /G27 /G28 /G29 /G2A 犌犅 / 犜 38667 — 2020 /G21 /G22 /G23 /G24   /G25 /G26 /G27   /G26 /G27 /G28 /G29 /G2A /G2B 犐狀犳狅狉犿犪狋犻狅狀狋犲犮犺狀狅犾狅犵狔 — 犅犻犵犱犪狋犪 — 犌狌犻犱犲犳狅狉犱犪狋犪犮犾犪狊狊犻犳犻犮犪狋犻狅狀 2020  04  28 /G2C /G2D 2020  11  01 /G2E /G2F /G27 /G28 /G2B /G2C /G2D /G2E /G2F /G30 /G31 /G32 /G27 /G28 /G29 /G2A /G33 /G2F /G30 /G34 /G35 /G36 /G2C /G2D目    次 前言 Ⅰ ………………………………………………………………………………………………………… 1   范围 1 ……………………………………………………………………………………………………… 2   规范性引用文件 1 ………………………………………………………………………………………… 3   术语和定义 1 ……………………………………………………………………………………………… 4   缩略语 2 …………………………………………………………………………………………………… 5   分类过程 2 …………………………………………………………………………………………………   5.1   概述 2 …………………………………………………………………………………………………   5.2   分类规划 3 ……………………………………………………………………………………………   5.3   分类准备 3 ……………………………………………………………………………………………   5.4   分类实施 4 ……………………………………………………………………………………………   5.5   结果评估 5 ……………………………………………………………………………………………   5.6   维护改进 5 …………………………………………………………………………………………… 6   分类视角 6 …………………………………………………………………………………………………   6.1   概述 6 …………………………………………………………………………………………………   6.2   技术选型视角 6 ………………………………………………………………………………………   6.3   业务应用视角 6 ………………………………………………………………………………………   6.4   安全隐私保护视角 6 ………………………………………………………………………………… 7   分类维度 6 …………………………………………………………………………………………………   7.1   概述 6 …………………………………………………………………………………………………   7.2   技术选型维度 7 ………………………………………………………………………………………   7.3   业务应用维度 9 ………………………………………………………………………………………   7.4   安全隐私保护维度 12 ………………………………………………………………………………… 8   分类方法 12 …………………………………………………………………………………………………   8.1   线分类法 12 ……………………………………………………………………………………………   8.2   面分类法 13 ……………………………………………………………………………………………   8.3   混合分类法 13 ………………………………………………………………………………………… 附录 A ( 资料性附录 )   大数据分类示例 14 ………………………………………………………………… 犌犅 / 犜 38667 — 2020 前    言    本标准按照 GB / T1.1 — 2009 给出的规则起草 。 请注意本文件的某些内容可能涉及专利 。 本文件的发布机构不承担识别这些专利的责任 。 本标准由全国信息技术标准化技术委员会 ( SAC / TC28 ) 提出并归口 。 本标准起草单位 : 中国科学院信息工程研究所 ( 信息安全国家重点实验室 )、 国家信息中心 、 浪潮软件集团有限公司 、 智慧神州 ( 北京 ) 科技有限公司 、 方正国际软件 ( 北京 ) 有限公司 、 国网安徽省电力有限公司 ( 电力科学研究院 )、 中国铁道科学研究院集团有限公司 、 中国电子技术标准化研究院 、 上海三零卫士信息安全有限公司 、 联通大数据有限公司 、 中国保险信息技术管理有限责任公司 、 九次方大数据信息集团有限公司 、 中电长城网际系统应用有限公司 、 广东电网有限责任公司信息中心 、 中电科大数据研究院有限公司 、 北京大学 、 山东省计算中心 ( 国家超级计算济南中心 )。 本标准主要起草人 : 陈驰 、 马红霞 、 马书南 、 田雪 、 高亚楠 、 黄先芝 、 单震 、 张慧敏 、 张煜 、 顾广宇 、 吴艳华 、 郑金子 、 尹卓 、 叶林 、 干露 、 关泰璐 、 李燕超 、 郎佩佩 、 闵京华 、 魏理豪 、 禄凯 、 张吉才 、 冯念慈 、 赵俊峰 、 史丛丛 、 孙嘉阳 。 Ⅰ 犌犅 / 犜 38667 — 2020 信息技术   大数据   数据分类指南 1   范围 本标准提供了大数据分类过程及其分类视角 、 分类维度和分类方法等方面的建议和指导 。 本标准适用于指导大数据分类 。 2   规范性引用文件 下列文件对于本文件的应用是必不可少的 。 凡是注日期的引用文件 , 仅注日期的版本适用于本文 件 。 凡是不注日期的引用文件 , 其最新版本 ( 包括所有的修改单 ) 适用于本文件 。 GB / T4754 — 2017   国民经济行业分类 GB / T35295 — 2017   信息技术   大数据   术语 3   术语和定义 GB / T35295 — 2017 界定的以及下列术语和定义适用于本文件 。 为了便于使用 , 以下重复列出了 GB / T35295 — 2017 中的某些术语和定义 。 3 . 1 大数据   犫犻犵犱犪狋犪 具有体量巨大 、 来源多样 、 生成极快 、 且多变等特征 , 并且难以用传统数据体系结构有效处理的包含 大量数据集的数据 。    注 : 国际上 , 大数据的 4 个特征普遍不加修饰地直接用 volume 、 variety 、 velocity 和 variability 予以表述 , 并分别赋予 了它们在大数据语境下的定义 : a )   体量   volume : 构成大数据的数据集的规模 。 b )   多样性   variety : 数据可能来自多个数据仓库 、 数据领域或多种数据类型 。 c )   速度   velocity : 单位时间的数据流量 。 d )   多变性   variability : 大数据其他特征 , 即体量 、 速度和多样性等特征都处于多变状态 。 [ GB / T35295 — 2017 , 定义 2.1.1 ] 3 . 2 数据集   犱犪狋犪狊犲狋 数据记录汇聚的数据形式 。    注 : 它可以具有大数据的体量 、 速度 、 多样性和易变性特征 。 数据集的特征表征的是数据本身或静态数据 , 而数据 的特征 , 当其在网络上传输时或暂时驻留于计算机存储器中以备读出或更新时 , 表征的是动态数据 。 [ GB / T35295 — 2017 , 定义 2.1.46 ] 3 . 3 大数据分类   犫犻犵犱犪狋犪犮犾犪狊狊犻犳犻犮犪狋犻狅狀 根据大数据的属性或特征 , 将其按一定的原则和方法进行区分和归类 , 并建立起一定的分类体系和 排列顺序的过程 。 1 犌犅 / 犜 38667 — 2020 3 . 4 分类主体   犮犾犪狊狊犻犳犻犮犪狋犻狅狀狊狌犫犼犲犮狋 大数据收集 、 存储 、 使用 、 分发 、 删除等过程中对大数据进行梳理归类的组织或个人 。 3 . 5 分类视角   犮犾犪狊狊犻犳犻犮犪狋犻狅狀犪狀犵犾犲 分类主体观察和开展大数据分类活动的角度 。 3 . 6 分类维度   犮犾犪狊狊犻犳犻犮犪狋犻狅狀犱犻犿犲狀狊犻狅狀 用于实现分类的数据所具有的某个或某些共同特征 。    注 : 常见数据分类维度包括产生来源 、 结构化特征 、 业务归属 、 处理时效性要求等 。 3 . 7 分类方法   犮犾犪狊狊犻犳犻犮犪狋犻狅狀犿犲狋犺狅犱 根据选定的分类维度 , 将数据类别以某种形式进行排列组织的逻辑方法 。 3 . 8 数据分发   犱犪狋犪犱犻狊狋狉犻犫狌狋犲 将原始数据 、 处理数据 、 分析结果等形式的数据传递给内部或外部实体的过程 。    注 : 数据分发包括线上或线下等多种方式 , 如数据交换 、 数据交易 、 数据共享 、 数据公开等 。 3 . 9 类别   犮犪狋犲犵狅狉狔 具有共同属性 ( 或特征 ) 的数据的集合 。 4   缩略语 下列缩略语适用本文件 。 ETL : 提取 、 转换和加载 ( ExtractTrans

.pdf文档 GB-T 38667-2020 信息技术 大数据 数据分类指南

文档预览
中文文档 18 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
GB-T 38667-2020 信息技术 大数据 数据分类指南 第 1 页 GB-T 38667-2020 信息技术 大数据 数据分类指南 第 2 页 GB-T 38667-2020 信息技术 大数据 数据分类指南 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2025-07-18 00:54:38上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。