高新民:建立“工业数据共同体”,实现数据价值最大化

时间:2023-03-31
作者: 齐旭

360截图16251112669372.png

“两化融合经过多年的发展,现在走到了数字化转型这个阶段。和前几年最大的不同是更强调工业互联网平台的作用,以及数据要素的深度利用和发掘。”3月28日,在第三届两化融合暨数字化转型大会上,国家信息化专家咨询委员会委员、中国互联网协会咨询委员会委员高新民表示,目前数据质量不高、流通不畅、融合应用等问题仍然突出,建议面向产业领域,建立能够实现数据流转通畅化、数据价值最大化的“工业数据共同体”。

数据的重要性不言而喻。在高新民看来,数据本身作为生产要素,是产业和企业运营的生命力所在,数据与场景会融合产生极大效益,让企业智能决策成为可能。此外,数据作为生产要素在流动过程中,会产生比原始数据更加有价值的数据模型、数据仓库、数据孪生等新服务新业态,是“数据增值”的体现。

尽管业界已经做了许多努力,但是以下三方面问题仍然有待解决。一是数据质量不高,有数据不好用。二是数据流通不畅,有数据不能用。这是因为海量数据往往呈现“异构”(不同的信息系统中数据结构不同)、“异主”(数据分散在不同的机构中,数据所有者不同,不能够随便去调用)和“异地”的特点,除了普遍存在不愿、不敢、不能共享的问题,还要看到在数据共享的过程中,流转的机制也不够灵活,过多强调数据要交易,但不是所有数据都适合或都能交易。三是数据和场景融合不足,有数据不会用。因为数据来源众多、结构复杂、体量庞大。哪些数据与哪些任务相关?哪些数据是有用的?在这样复杂的数据环境下,如何在海量数据中挖掘与需求强相关、高质量的数据,使它真正发挥价值,目前还要多加探索。

出路在哪?高新民认为,一是理顺数据流转的思路,二是建设数据的基础设施。

在理顺数据流转的思路方面,要建立多元化、清晰化的数据流通机制。因为数据要素资产化的前提是有边界、可识别、有潜在价值,必须有这三个条件才能够资产化。如数据库、数据文件、数字孪生等形式的数据已经成型,但除了已经形成产品以外的数据,还有很多是属于原始数据,比如GTP3.5的参数是1750亿个,文本的词汇量大概是45000亿,怎样使如此海量的数据真正有用?那就是要把数据“对象化”。

数据价值很大程度上取决于流通,数据价值流通过程中与场景强关联。因此数据流通机制要随场景而多元,比如有些场景下数据适合交易,有些场景下数据适合共享,数据流通机制当中,市场化是一个重要选项,但不能唯市场化、唯交易化,应该在遵循数据主权的前提下倡导数据共享,尤其是政府和公共数据要强调数据开放。

“三异”数据的流通基础是数据的互操作,只有在互操作基础上才有共享、开放、交易。分布在不同信息系统中的海量数据,目前更多地是通过人为查找,怎样减少人的干预,由机器自动能找到?因此要让数据具有可发现性、可访问性、互操作性和可重用性。

在建设数据的基础设施方面,高新民指出,现在数字基础设施的构成,主要有作为基础的通信网络基础设施,比如5G、千兆光网、卫星互联网等;主要负责存储数据的数据中心体系;还有承担东数西算中数据算力调度的算力网络基础设施。还应该加入“数据网络基础设施”。他建议把数据网络基础设施的概念列入到数字基础设施中。

2016年,欧盟在德国工业4.0的过程中发现了数据的价值,提出了“工业数据空间IDS”的概念,2017-2019年扩展成了欧盟的数据基础设施,现在已成为国际数据互联网中的生态。目前已经与华为、中国电信、上海交大、信通院等一些中国企业和研究机构合作。这个架构完全是开放的,在不同空间形成了多种数据共存架构,坚持数据主权、数据安全交换等原则。

“我建议在工业领域,建立‘工业数据共同体’,设置如汽车、钢铁、化工等行业大类。所谓‘数据共同体’,就是基于业务强关联的、众多企业参与的、按照一定标准建立共识制度的共建共享技术架构,实现数据流转通畅化、数据价值最大化、支持产业高质量发展的数据利益共同体。”高新民表示。