近日,《海洋大数据标准体系》通过全国海洋标准化技术委员会审查,将于2022年5月1日起实施。该标准由国家海洋信息中心牵头编制。作为首项海洋领域的大数据标准,《海洋大数据标准体系》规定了海洋大数据体系结构和标准明细表,制定了海洋领域的大数据标准的规划和计划,为海洋领域大数据标准的组成以及制修订框定了范围。
该标准的发布为海洋大数据技术标准、平台和工具标准、管理标准、安全标准和应用标准等提供了制修订依据,为我国海洋大数据标准体系建设发展奠定了基石,有效推动海洋大数据领域标准建设,在海洋大数据标准领域具有重要里程碑意义。
海洋观测数据呈指数级增长
大数据及人工智能技术正在全球引发一场深刻的地球科学研究革命,随着海洋观测数据的指数级增长和海量数据计算分析能力提升,海洋环境数据已进入大数据时代。
联合国“海洋十年”计划中指出,数据和信息是实现“海洋十年”成果的关键推动因素。美国国家海洋和大气管理局也制定了大数据和人工智能长期战略,将充分利用机器学习来改善或替代现有的核心技术,以改善预报和数据服务。
20世纪80年代以来,国际上持续推进全球业务化海洋观测,并组织实施了一系列重大国际合作计划,欧美等国和我国均相继发射了一系列海洋观测卫星。我国针对近海及关注大洋区域,相继实施了海洋普查、海洋专项调查、业务化海洋观监测、海洋科学考察等活动,已经积累了大量的海洋环境实测、基础地理和海洋资源等数据,以及时间跨度超过60年的全球海洋再分析数据等。
大数据标准化工作是支撑大数据产业发展和应用的重要基础。因此,为更加科学、有效地开展数据处理和分析应用,加强数据管理和服务,迫切需要海洋大数据标准体系,为进一步发挥海洋数据的应用价值提供技术保障。
海洋大数据的六项标准体系
海洋大数据标准体系主要包含基础通用标准、技术标准、平台和工具标准、管理标准、安全标准、应用标准六大类。
基础通用标准参考相关大数据规范,结合海洋大数据通用、共性指标,综合确定了包括参考模型、术语、分类、编码等通用型标准。
技术标准主要是针对数据从创建到处理的数据生命周期,研究相关大数据关键技术,结合海洋数据业务流程,从数据采集、数据处理、质量控制等关键节点确定需要制订海洋大数据技术标准计划。
平台和工具标准结合海洋数据业务建设过程涉及的平台和工具,从数据计算平台、管理平台、服务平台三个方面提出标准制修订计划。管理标准作为技术标准和平台工具的支撑体系,贯穿于数据生命周期的各个阶段,主要从存储管理和运维管理两个方面提出标准制修订计划。
安全标准主要用于数据安全和隐私保护,针对数据/信息安全的方法指导、监测评估和要求等安全技术内容,确定从数据安全、信息技术安全两个方面提出标准制修订计划。
应用标准从共享服务和专题应用两个方面提出标准制修订计划,其中共享服务标准通过制定共享服务接口、共享交换记录格式等标准保障海洋数据的交换共享;专题应用标准从海洋经济、海洋生态、海洋政务管理等方面提出大数据的应用方向。
整个标准共规定了169项国家/行业标准,已颁布或立项97项,待制定72项,其中海洋大数据应用标准待制修订的数量较大,说明大数据在专题应用和服务共享上存在较大的差距,下一步可以加大该类标准的申报立项,促进大数据在海洋领域的应用落地。
海洋大数据的内涵和特征
海洋大数据是指为决策海洋问题提供服务的海洋大数据资源、海洋大数据技术和海洋大数据应用的总称。
其中,海洋大数据资源是指一个海洋决策问题可能遇到的所有数据,通常数据量巨大、来源多样、类型多样;海洋大数据技术是指海洋大数据资源获取、存储管理、挖掘分析、可视展现等技术;海洋大数据应用是指海洋大数据资源和海洋大数据技术来支撑海洋决策活动,是新的决策方法。
同时,海洋大数据具有“4V+5H”的特征。“4V”是指海洋数据量巨大(Volume)、数据类型多样(Va-riety)、数据流动快速(Velocity)和数据价值巨大(Value)。
其中,数据量巨大是指随着探测设备和信息技术的不断发展,海洋信息获取的速度和精度也在不断提高,获取的海洋数据量越来越大,海洋数据呈现出海量特征;数据类型多样是指海洋数据获取手段的多样化以及海洋观测要素的多元化,使得海洋数据类型呈现出多类性特征;数据流动快速是指随着全球海洋观测系统的不断完善,海洋数据更新频率越来越快,大量实时数据更新速度到秒级;数据价值巨大是指海洋数据本身代表的物理机理能够开展海浪、潮汐潮流、风暴潮等海洋灾害的预测、预警和预报工作,蕴藏着巨大的经济价值。
海洋大数据还具有强时空关联(High Correla-tion)、高耦合(High Coupling)、高变率(High Diversifi-cation)、多层次性(Hierarchy)和高规律性(High Reg-ularity)的“5H”特征。
其中,强关联性是指海洋大数据具有明确的时空属性特征和意义,多个数据、要素之间更是存在时间和空间上的相互关联;高耦合性是指海洋与陆地、大气、人类活动等都有着各种复杂的相互作用,相互之间存在着强烈的耦合性;高变率性是指海洋是瞬息万变的,同一要素在同一地点、不同时间都在不断的变化,多个要素不断发生相互作用,从而产生出变化的环境和现象;多层次性是指海洋中存在着混合层、温跃层、温度锋、盐度锋、涡、内波等物理化学现象,具有四维的结构特征。高规律性是指从宏观上来看,海洋水体环境、海洋生态等系统都存在着月、季、年、年代际等周期性的变化,导致海洋数据也存在着多周期叠加的规律。
技术标准的应用实践
近年来,国家海洋信息中心积极推动大数据技术与海洋行业的深度融合,充分发挥海洋大数据标准体系的指导作用。
国家海洋信息中心研发了海洋环境大数据分析预报系统,实现了海表温、海面高、三维温盐、台风移动路径、赤潮发生概率等大数据分析预报,系统在东海预报中心和福建省海洋预报台开展示范应用,另外还开展了基于大数据的海洋生态分类分区、海洋矿产资源潜力预测等技术研究并投入应用。
国家海洋信息中心支持浙江智慧海洋大数据中心建设,形成可复制可推广的数据运营和应用服务模式,协助辽宁、天津、江苏、福建、海南等地方开展大数据中心设计,有力推进国家海洋大数据地方节点规划布局,在支撑沿海地方海洋大数据中心建设过程中,充分发挥海洋大数据标准的支撑作用。
另外,近三年来,依托中心海洋数据管理和中国-东盟海洋大数据服务平台等建设技术与经验,国家海洋信息中心向登嘉楼大学承建的马来西亚国家级海洋数据中心和马来西亚海洋大数据体系建设提供智力和技术支持,围绕马来西亚海洋大数据架构、建设标准和技术路线等方面提供技术支撑。该项目的合作进一步推动了我国海洋数据技术和标准“走出去”,对于深入引领东盟和西太地区海洋数据科技合作进行了有效实践。
下一步,国家海洋信息中心将积极推进国家海洋大数据共享应用平台论证和落地,加快推进极地和深海大数据中心建设,持续推进基于大数据和人工智能的海洋环境快速预报技术研发,推进海洋生态大数据、海洋经济大数据、海域海岛管理大数据等专题技术研究和应用示范,推动海洋大数据分析预测功能要求、海洋专题大数据挖掘分析技术参考模型等标准编制和立项。(作者:国家海洋信息中心海洋数据管理中心 宋晓 梁志翔)