说明:收录25万 73个行业的国家标准 支持批量下载
文库搜索
切换导航
文件分类
频道
文件分类
批量下载
书 书 书犐犆犛 35 . 240 犔 67 中华人民共和国国家标准 犌犅 / 犜 38673 — 2020 信息技术 大数据大数据系统基本要求 犐狀犳狅狉犿犪狋犻狅狀狋犲犮犺狀狅犾狅犵狔 — 犅犻犵犱犪狋犪 — 犅犪狊犻犮狉犲狇狌犻狉犲犿犲狀狋狊犳狅狉犫犻犵犱犪狋犪狊狔狊狋犲犿狊 2020 04 28 发布 2020 11 01 实施 国家市场监督管理总局 国家标准化管理委员会 发布书 书 书目 次 前言 Ⅲ ………………………………………………………………………………………………………… 1 范围 1 ……………………………………………………………………………………………………… 2 规范性引用文件 1 ………………………………………………………………………………………… 3 术语和定义 1 ……………………………………………………………………………………………… 4 缩略语 1 …………………………………………………………………………………………………… 5 大数据系统框架 2 ………………………………………………………………………………………… 6 功能要求 3 ………………………………………………………………………………………………… 6.1 数据收集模块 3 ……………………………………………………………………………………… 6.2 数据预处理模块 3 …………………………………………………………………………………… 6.3 数据存储模块 3 ……………………………………………………………………………………… 6.4 数据处理模块 4 ……………………………………………………………………………………… 6.5 数据分析模块 5 ……………………………………………………………………………………… 6.6 数据可视化模块 6 …………………………………………………………………………………… 6.7 数据访问模块 6 ……………………………………………………………………………………… 6.8 资源管理模块 6 ……………………………………………………………………………………… 6.9 系统管理模块 6 ……………………………………………………………………………………… 7 非功能要求 6 ……………………………………………………………………………………………… 7.1 可靠性要求 6 ………………………………………………………………………………………… 7.2 兼容性要求 7 ………………………………………………………………………………………… 7.3 安全性要求 7 ………………………………………………………………………………………… 7.4 可扩展性要求 8 ……………………………………………………………………………………… 7.5 维护性要求 8 ………………………………………………………………………………………… 7.6 易用性要求 8 ………………………………………………………………………………………… Ⅰ 犌犅 / 犜 38673 — 2020 前 言 本标准按照 GB / T1.1 — 2009 给出的规则起草 。 请注意本文件的某些内容可能涉及专利 。 本文件的发布机构不承担识别这些专利的责任 。 本标准由全国信息技术标准化技术委员会 ( SAC / TC28 ) 提出并归口 。 本标准起草单位 : 中国电子技术标准化研究院 、 华为技术有限公司 、 北京大学 、 中国人民大学 、 中兴通讯股份有限公司 、 浪潮电子信息产业股份有限公司 、 阿里云计算有限公司 、 天津南大通用数据技术有限公司 、 北京百分点信息科技有限公司 、 复旦大学 、 南京大学 、 东南大学 、 北京和仲宁信息技术有限公司 、 北京启迪区块链科技发展有限公司 。 本标准主要起草人 : 梅宏 、 孙文龙 、 杜小勇 、 吴东亚 、 董建 、 张群 、 尹卓 、 许洁 、 李冰 、 李瑛 、 高琨 、 朱松 、 赵江 、 张展新 、 梁佳男 、 赵俊峰 、 符海芳 、 卫凤林 、 孙嘉阳 、 赵菁华 、 陈晋川 、 刘海军 、 孙伟 、 姜育刚 、 周志华 、 张敏灵 。 Ⅲ 犌犅 / 犜 38673 — 2020 信息技术 大数据大数据系统基本要求 1 范围 本标准规定了大数据系统的功能要求和非功能要求 。 本标准适用于各类大数据系统要求的设计 、 选型 、 验收和检测 。 2 规范性引用文件 下列文件对于本文件的应用是必不可少的 。 凡是注日期的引用文件 , 仅注日期的版本适用于本文 件 。 凡是不注日期的引用文件 , 其最新版本 ( 包括所有的修改单 ) 适用于本文件 。 GB / T35295 — 2017 信息技术 大数据 术语 GB / T35589 — 2017 信息技术 大数据 技术参考模型 3 术语和定义 GB / T35295 — 2017 界定的以及下列术语和定义适用于本文件 。 为了便于使用 , 以下重复列出了 GB / T35295 — 2017 中的某些术语和定义 。 3 . 1 大数据系统 犫犻犵犱犪狋犪狊狔狊狋犲犿 实现大数据参考体系结构的全部或部分功能的系统 。 [ GB / T35295 — 2017 , 定义 2.1.14 ] 3 . 2 分布式计算 犱犻狊狋狉犻犫狌狋犲犱犮狅犿狆狌狋犻狀犵 一种覆盖存储层和处理层的 、 用于实现多类型程序设计算法模型的计算模式 。 注 : 分布式计算结果通常加载到分析环境 。 MapReduce 是数据分布式计算中默认的处理构件 。 [ GB / T35295 — 2017 , 定义 2.1.22 ] 3 . 3 集群 犮犾狌狊狋犲狉 一组相互独立的 、 通过高速网络互联的计算机或服务器 。 3 . 4 租户 狋犲狀犪狀狋 对一组物理和虚拟资源进行共享访问的一个或多个云服务用户 。 4 缩略语 下列缩略语适用于本文件 。 1 犌犅 / 犜 38673 — 2020 API : 应用程序接口 ( ApplicationProgrammingInterface ) CPU : 中央处理器 ( CentralProcessingUnit ) DAG : 有向无环图 ( DirectedAcyclicGraph ) OLAP : 联机分析处理 ( OnLineAnalyticalProcessing ) REST : 表述性状态转移 ( RepresentationalStateTransfer ) SQL : 结构化查询语言 ( StructuredQueryLanguage ) 5 大数据系统框架 GB / T35589 — 2017 定义了大数据参考架构 , 如图 1 所示 。 大数据参考模型是一个通用的大数据 系统概念模型 , 它表示了通用的 、 与技术无关的大数据系统的逻辑功能构件及构件之间的互操作接口 , 作为开发各种具体类型大数据应用系统架构的通用技术参考框架 。 图 1 大数据参考架构 本标准参考大数据参考架构逻辑功能构件划分 , 将大数据系统划分为数据收集 、 数据预处理 、 数据 存储 、 数据处理 、 数据分析 、 数据访问 、 数据可视化 、 资源管理 、 系统管理 9 个模块 。 大数据系统框架如 图 2 所示 。 2 犌犅 / 犜 38673 — 2020 图 2 大数据系统框架 6 功能要求 6 . 1 数据收集模块 数据收集模块要求如下 : a ) 应提供数据导入功能 , 支持结构化数据 、 非结构化数据和半结构化数据导入 ; b ) 应支持离线数据导入和实时数据导入 ; c ) 应支持全量数据导入和增量数据导入 ; d ) 应提供自动定时导入数据功能 ; e ) 宜提供开放的数据导入 API ; f ) 宜提供图形界面实现数据导入功能 。 6 . 2 数据预处理模块 数据预处理模块要求如下 : a ) 应提供数据抽取功能 , 支持对结构化数据 、 非结构化数据和半结构化数据进行抽取 ; b ) 应提供数据清洗功能 , 支持对不一致数据 、 无效数据 、 缺失数据和重复数据的处理 ; c ) 应提供结构化数据的列转换 、 行转换和表转换功能 ; d ) 应提供数据加载功能 , 支持将经过清洗和转换的数据加载到数据分析模块 ; e ) 宜提供清洗前后的数据比对功能 ; f ) 宜支持非结构化数据的数据转换功能 。 6 . 3 数据存储模块 数据存储模块要求如下 : a ) 应提供数据存储功能 , 支持结构化数据 、 非结构化数据和半结构化数据存储 。 b ) 应提供与关系型数据库 、 其他文件系统之间交换数据或文件的功能 。 c ) 支持分布式文件存储 , 实现以下功能 : 3 犌犅 / 犜 38673 — 2020 1 ) 应支持文件系统基本操作 , 包括上传 、 下载 、 读写 、 复制 、 移动 、 删除 、 重命名 、 权限修改等 ; 2 ) 应提供数据块多副本存储 、 恢复功能 ; 3 ) 宜支持文件快速检索功能 , 支持数据资源的统一检索 、 编目 、 增加和删除操作 ; 4 ) 宜支持数据压缩存储
GB-T 38673-2020 信息技术 大数据 大数据系统基本要求
文档预览
中文文档
11 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2元下载(无需注册)
温馨提示:本文档共11页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2元下载
本文档由 人生无常 于
2025-07-18 00:54:52
上传分享
举报
下载
原文档
(928.7 KB)
分享
友情链接
ISO 17215-3 2021 Road vehicles — Video communication interface for cameras (VCIC) — Part 3 Camera message dictionary.pdf
ISO 6552 1980 Automatic steam traps — Definition of technical terms.pdf
ISO 6028 2023 Healthcare organization management — Pandemic response — Functiona.pdf
ISO-TS 15926-4 2024 Industrial automation systems and integration Integration of life-cycle data for process plants including oil and gas production facilities Part 4 Core reference data.pdf
ISO 4254-14 2016 Agricultural machinery — Safety — Part 14 Bale wrappers.pdf
ISO 2827-1988Photography. Electronic flash equipment. Determination of light output and performance.pdf
ISO TR 16314 2010 Rubber — Measurement of the aromaticity of oil in reclaimed rubbers.pdf
ISO 26203-1 2018 Metallic materials — Tensile testing at high strain rates — Part 1 Elastic-bar-type systems.pdf
ISO 11064-1 2000 Ergonomic design of control centres — Part 1 Principles for the design of control centres.pdf
ISO 19674 2017 Fine ceramics (advanced ceramics advanced technical ceramics) Methods of test for ceramic coatings Determination of internal stress in ceramic coatings by application of the Stoney fo.pdf
GB-T 8338-2005 照相机快门.pdf
GB-T 26178-2010 光通量的测量方法.pdf
GB-T 11130-1989 煤油燃烧性测定法.pdf
GB-T 15970.3-1995 金属和合金的腐蚀 应力腐蚀试验 第3部分 U型弯曲试样的制备和应用.pdf
GB-T 22921-2008 纸和纸板 薄页材料水蒸气透过率的测定 动态气流法和静态气体法.pdf
GB-T 12470-2018 埋弧焊用热强钢实心焊丝、药芯焊丝和焊丝-焊剂组合分类要求.pdf
GB-T 3804-2017 3.6 kV~40.5 kV高压交流负荷开关.pdf
GB-T 25119-2021 轨道交通 机车车辆电子装置.pdf
GB-T 34839-2017 计时仪器 柄头和密封管的设计和尺寸.pdf
GB-T 18901.1-2002 光纤传感器 第1部分 总规范.pdf
1
/
3
11
评价文档
赞助2元 点击下载(928.7 KB)
回到顶部
×
微信扫码支付
2
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。