倪光南:建立大数据支撑平台有效解决数据治理难题

时间:2021-10-20
作者: 中国科技新闻网

中国科技新闻网10月19日讯(赵芙瑶)在数据呈几何量增长的大数据时代,人类社会对于数据的利用率达到了前所未有的巅峰,然而随之而来的个人隐私安全问题,也成为了数据价值开发及数据开放共享的瓶颈。

同时,大数据存在鱼龙混杂的特点,数据中可能夹杂无用的、虚假的信息,如何进行核心信息的有效提取也十分关键。所以,我国现阶段对于大数据的治理需求十分迫切,数据隐私安全与算法伦理问题也亟待解决。

在2021大数据科技传播与应用高峰论坛暨“科创中国”试点城市推进式会后,计算机专家、中国工程院院士、中国科学院计算技术研究所研究员倪光南接受了中国科技新闻网专访,就有关大数据的隐私伦理与治理共享等议题发表了建言,并展望了大数据的未来应用前景与发展趋势。

11.png

图:倪光南院士中国科技新闻网/摄

数据质量良莠不齐大数据支撑平台让数据治理更简单

互联网极具开放性和包容性,对待数据“来者不拒”,形成了“储存易,遗忘难”的局面。数据一旦进入互联网,便被永久留存,各式各样的线上数据经过日积月累,使数据质量良莠不齐,数据格式也各不相同。

中国信通院发布的《2020年数据治理研究报告》显示,根据国际数据公司(IDC)预测,2025年全球数据量将达到163ZB。数据产业规模也持续扩张,据IDC预测,2019-2023年全球大数据市场相关收益将实现13.1%的复合年均增长率,2023年总收益将达到3126.7亿美元。

在数据量和数据产业规模都如此庞大的情况之下,数据如何治理才能保障收益的最大化?对此倪光南首先强调了网络对数据的重要性:“想要做好数据治理,首先需要保证网络的畅通无阻。网络时代发展到一定阶段后,物理网络受到很多制约,所以提出了软件定义网络的概念,通过软件定义网络,我们能够保障用户在应用网络时更加简单透明。目前有一些公司通过自主创新推出了数据网络技术,可以通过大数据应用的需求来定义网络。”

此外,倪光南指出,不同时代产生的数据格式不同,它们之间往往不能互相连通、互相兼容,所以需要解决数据融合的问题,这是数据治理的第二步。他还提出要建立大数据支撑平台,使得大数据能够更好的为国家政府治理的现代化、为数据经济的转型升级发挥作用。

倪光南进一步解释道:“大数据应用的时候,可能面临不同的应用需求,比如金融、能源、通信等各个领域,这就要求发展相应的各种算法,用人工智能技术去解决具体应用的问题。同时,我们要有强大的计算力的作为保障,才能够及时的处理海量数据。”

数据安全亟需保障完善立法势在必行

目前,各类APP的功能有赖于对用户信息的收集、分析及共享,就像淘宝需要搜集用户的产品偏好,饿了么、美团需要搜集用户的饮食偏好。但目前行业规范和行业自律存在一定缺失,不少用户觉得自己的隐私被暴露在“阳光下”,这背后也隐藏着巨大的安全隐患。而许多用户因为信息自决权和数据保护意识的缺失,导致其难以察觉可能存在的隐私风险,一些用户甚至会因APP派发的类似于“实名认证红包”等噱头,不假思索的“奉献”出自己的真实姓名、家庭住址甚至人脸生物信息。等后期“遇到危机”,用户也缺乏有效的维权途径与手段。

尤其在2020年新冠疫情爆发的情况下,数字化转型按下快进键,社会运转加速构筑于数据之上,民众出行经常碰到需要登记个人具体信息以及体温的情况,个人信息一旦被泄漏,就有可能收到各类骚扰电话甚至诈骗信息,数据安全问题也就引起了大家的重视,“隐私保护”和“公共健康”之间,需要寻找平衡点。

那么在数据呈井喷式增长、数据隐私无处循行的情况下,数据安全应如何保障?对此,倪光南表示,早在2018年,欧洲联盟就出台了《通用数据保护条例》(General Data Protection Regulation,简称GDPR),该条例的适用范围极为广泛,任何收集、传输、保留或处理涉及到欧盟所有成员国内的个人信息的机构组织均受该条例的约束。

倪光南还表示,完善立法与发展大数据应用应同步进行。“欧洲在数据安全方面的考虑是比较严格的。中国前不久也发布了《数据安全法》,规范了数据处理活动,保障数据安全。它在实践过程中还需要不断的完善,要围绕法规制定各种各样的具体的规定和约束条件,在完善法律法规同时我们也要发展好大数据的应用,两方面都要很好的结合起来,互相促进,互相推进。要加强社会治理和治理能力的现代化,治理能力现代化体系建设,离不开大数据的支撑。”

2020年,数据治理和数据隐私安全保护领域展现了更多的具体行动方案,从混沌走向秩序重建,为数字治理提供了新的选项。人类社会共同迈向数字时代,需携手共建彼此认同的数据规则,构建个人、企业、政府之间的信任基石,共享数字经济带来的发展利益与社会福祉。