说明:收录25万 73个行业的国家标准 支持批量下载
文库搜索
切换导航
文件分类
频道
文件分类
批量下载
书 书 书犐犆犛 35 . 240 犔 67 /G21 /G22 /G23 /G24 /G25 /G26 /G27 /G27 /G28 /G29 /G2A 犌犅 / 犜 37721 — 2019 /G21 /G22 /G23 /G24 /G25 /G26 /G27 /G28 /G29 /G2A /G2B /G2C /G2D /G2E /G2F 犐狀犳狅狉犿犪狋犻狅狀狋犲犮犺狀狅犾狅犵狔 — 犉狌狀犮狋犻狅狀犪犾狉犲狇狌犻狉犲犿犲狀狋狊犳狅狉犫犻犵犱犪狋犪犪狀犪犾狔狋犻犮狊狔狊狋犲犿狊 2019 08 30 /G30 /G31 2020 03 01 /G32 /G33 /G27 /G28 /G2B /G2C /G2D /G2E /G2F /G30 /G31 /G32 /G21 /G27 /G27 /G28 /G29 /G2A /G33 /G2F /G30 /G34 /G35 /G36 /G30 /G31书 书 书目 次 前言 Ⅲ ………………………………………………………………………………………………………… 1 范围 1 ……………………………………………………………………………………………………… 2 规范性引用文件 1 ………………………………………………………………………………………… 3 术语和定义 1 ……………………………………………………………………………………………… 4 缩略语 1 …………………………………………………………………………………………………… 5 总体要求 2 ………………………………………………………………………………………………… 6 数据准备模块功能要求 2 ………………………………………………………………………………… 6.1 数据抽取功能要求 2 ………………………………………………………………………………… 6.2 数据清洗功能要求 2 ………………………………………………………………………………… 6.3 数据转换功能要求 3 ………………………………………………………………………………… 6.4 数据加载功能要求 3 ………………………………………………………………………………… 7 分析支撑模块功能要求 3 ………………………………………………………………………………… 7.1 查询功能要求 3 ……………………………………………………………………………………… 7.2 机器学习功能要求 4 ………………………………………………………………………………… 7.3 统计分析功能要求 4 ………………………………………………………………………………… 7.4 可视化功能要求 4 …………………………………………………………………………………… 8 数据分析模块功能要求 5 ………………………………………………………………………………… 8.1 分析模式 5 …………………………………………………………………………………………… 8.2 分析类型 6 …………………………………………………………………………………………… 9 流程编排模块功能要求 6 ………………………………………………………………………………… 9.1 工作流管理 6 ………………………………………………………………………………………… 9.2 告警和日志 6 ………………………………………………………………………………………… 附录 A ( 资料性附录 ) SQL 关键字 7 ……………………………………………………………………… Ⅰ 犌犅 / 犜 37721 — 2019 前 言 本标准按照 GB / T1.1 — 2009 给出的规则起草 。 请注意本文件的某些内容可能涉及专利 。 本文件的发布机构不承担识别这些专利的责任 。 本标准由全国信息技术标准化技术委员会 ( SAC / TC28 ) 提出并归口 。 本标准起草单位 : 浪潮电子信息产业股份有限公司 、 中国电子技术标准化研究院 、 勤智数码科技股份有限公司 、 杭州海康威视数字技术股份有限公司 、 浪潮软件集团有限公司 、 上海计算机软件技术开发中心 、 新华三技术有限公司 、 天津南大通用数据技术股份有限公司 、 中兴通讯股份有限公司 、 华为技术有限公司 、 星环信息科技 ( 上海 ) 有限公司 、 北京百分点信息科技有限公司 、 北明软件有限公司 、 哈尔滨哈工大大数据通用技术有限公司 、 国网上海市电力公司 、 陕西省信息化工程研究院 、 南京南瑞信息通信科技有限公司 、 广州浪潮大数据研究有限公司 、 杭州中奥科技有限公司 、 科大讯飞股份有限公司 。 本标准主要起草人 : 苏志远 、 张东 、 赵江 、 卫凤林 、 张群 、 刘宇峰 、 李正 、 赵世范 、 黄先芝 、 王建华 、 陈敏刚 、 刘振宇 、 蔡立志 、 潘子健 、 赵伟 、 孙卡 、 吴文峰 、 刘蔚 、 王东 、 赵华 、 符海芳 、 周洪明 、 孙伟 、 汪疆平 、 王进宏 、 赵志强 、 王刚 、 王宏志 、 郭乃网 、 苏运 、 张勇 、 孙立华 、 汤宁 、 刘广庆 、 沈贝伦 、 陆韵 、 武新 、 张绍勇 、 赵乾 、 李冰 、 尹卓 、 孙嘉阳 。 Ⅲ 犌犅 / 犜 37721 — 2019 信息技术 大数据分析系统功能要求 1 范围 本标准规定了大数据分析系统的数据准备模块 、 分析支撑模块 、 数据分析模块和流程编排模块的功能要求 。 本标准适用于大数据分析系统的设计 、 开发和应用部署 。 2 规范性引用文件 下列文件对于本文件的应用是必不可少的 。 凡是注日期的引用文件 , 仅注日期的版本适用于本文件 。 凡是不注日期的引用文件 , 其最新版本 ( 包括所有的修改单 ) 适用于本文件 。 GB / T35295 — 2017 信息技术 大数据 术语 3 术语和定义 GB / T35295 — 2017 界定的以及下列术语和定义适用于本文件 。 3 . 1 大数据分析系统 犫犻犵犱犪狋犪犪狀犪犾狔狋犻犮狊狔狊狋犲犿狊 在大数据存储和处理系统提供的原始数据和计算框架的基础上 , 集成了一系列数据分析生存周期过程中所用工具的系统 。 3 . 2 结构化数据 狊狋狉狌犮狋狌狉犲犱犱犪狋犪 存储在数据库里 , 可以用二维表结构表示的数据 。 3 . 3 非结构化数据 狌狀狊狋狉狌犮狋狌狉犲犱犱犪狋犪 除了结构化数据之外的没有明确结构约束的数据 。 3 . 4 分布式执行计划 犱犻狊狋狉犻犫狌狋犲犱犲狓犲犮狌狋犻狅狀狆犾犪狀 分布式场景下的 SQL 查询计划 , 需要根据数据分布特点将 SQL 拆分成多个切片及多个步骤 , 提供调度给多节点并行执行 。 4 缩略语 下列缩略语适用于本文件 。 API : 应用程序编程接口 ( ApplicationProgrammingInterface ) GPU : 图形处理器 ( GraphicsProcessingUnit ) JSON : JS 对象标记 ( JavaScriptObjectNotation ) OLAP : 联机分析处理 ( OnLineAnalyticalProcessing ) REST : 表述性状态转移 ( RepresentationalStateTransfer ) 1 犌犅 / 犜 37721 — 2019 SQL : 结构化查询语言 ( StructuredQueryLanguage ) SSD : 固态硬盘 ( SolidStateDrives ) XML : 可扩展置标语言 ( ExtensibleMarkupLanguage ) 5 总体要求 本标准主要从以下 4 个方面对大数据分析系统的基本功能做出要求 : a ) 数据准备模块的功能要求 : 对原始数据进行预处理 , 使数据能被上层分析方法直接使用 ; b ) 分析支撑模块的功能要求 : 提供建立数据模型和应用模型的算法库或者工具库 ; c ) 数据分析模块的功能要求 : 提供数据分析方法或者中间件 , 将数据准备模块输出的数据以及数 据建模过程中产生的中间数据转变成知识或者决策 ; d ) 流程编排模块的功能要求 : 按照工作流对数据处理生存周期的各环节进行编排 。 各模块间存在相互作用的关系 , 如图 1 所示 。 图 1 大数据分析系统框架 6 数据准备模块功能要求 6 . 1 数据抽取功能要求 数据抽取模块要求如下 : a ) 应支持按照需求将存放在存储系统中的数据进行抽取 ; b ) 应提供对结构化数据 、 非结构化数据的不同抽取方法 ; c ) 应提供全量抽取及增量抽取模式 ; d ) 应支持主动抽取和被动追加 ; e ) 应支持定时批量抽取 ; f ) 宜支持分布式数据抽取 , 实现数据抽取过程的负载均衡 。 6 . 2 数据清洗功能要求 数据清洗模块要求如下 : a ) 应支持数据一致性 ; 2 犌犅 / 犜 37721 — 2019 b ) 应支持处理无效值 , 包括无效数据值的删除 、 修正等 ; c ) 应支持处理缺失值 , 包括缺失值的填充或缺失值对应数据条目的删除等 ; d ) 应支持处理重复数据 , 包括重复数据的合并或者
GB-T 37721-2019 信息技术 大数据分析系统功能要求
文档预览
中文文档
15 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2元下载(无需注册)
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2元下载
本文档由 人生无常 于
2025-07-18 00:26:42
上传分享
举报
下载
原文档
(842.9 KB)
分享
友情链接
ISO 17215-3 2021 Road vehicles — Video communication interface for cameras (VCIC) — Part 3 Camera message dictionary.pdf
ISO 6552 1980 Automatic steam traps — Definition of technical terms.pdf
ISO 6028 2023 Healthcare organization management — Pandemic response — Functiona.pdf
ISO-TS 15926-4 2024 Industrial automation systems and integration Integration of life-cycle data for process plants including oil and gas production facilities Part 4 Core reference data.pdf
ISO 4254-14 2016 Agricultural machinery — Safety — Part 14 Bale wrappers.pdf
ISO 2827-1988Photography. Electronic flash equipment. Determination of light output and performance.pdf
ISO TR 16314 2010 Rubber — Measurement of the aromaticity of oil in reclaimed rubbers.pdf
ISO 26203-1 2018 Metallic materials — Tensile testing at high strain rates — Part 1 Elastic-bar-type systems.pdf
ISO 11064-1 2000 Ergonomic design of control centres — Part 1 Principles for the design of control centres.pdf
ISO 19674 2017 Fine ceramics (advanced ceramics advanced technical ceramics) Methods of test for ceramic coatings Determination of internal stress in ceramic coatings by application of the Stoney fo.pdf
GB-T 8338-2005 照相机快门.pdf
GB-T 26178-2010 光通量的测量方法.pdf
GB-T 11130-1989 煤油燃烧性测定法.pdf
GB-T 15970.3-1995 金属和合金的腐蚀 应力腐蚀试验 第3部分 U型弯曲试样的制备和应用.pdf
GB-T 22921-2008 纸和纸板 薄页材料水蒸气透过率的测定 动态气流法和静态气体法.pdf
GB-T 12470-2018 埋弧焊用热强钢实心焊丝、药芯焊丝和焊丝-焊剂组合分类要求.pdf
GB-T 3804-2017 3.6 kV~40.5 kV高压交流负荷开关.pdf
GB-T 25119-2021 轨道交通 机车车辆电子装置.pdf
GB-T 34839-2017 计时仪器 柄头和密封管的设计和尺寸.pdf
GB-T 18901.1-2002 光纤传感器 第1部分 总规范.pdf
1
/
3
15
评价文档
赞助2元 点击下载(842.9 KB)
回到顶部
×
微信扫码支付
2
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。