张春湃: 百度可信数据空间解决方案——数智驱动价值流通新范式

时间:2025-09-03

微信图片_20250828170828_3609_13 - 副本.png

8月21日,由中国信息协会主办,中国信息协会大数据分会承办,信息化观察网、天津市大数据协会、京津产业新城高村数智创新园、国润互联信息技术研究院协办的“2025可信数据空间推进大会”成功召开。百度智能云政务行业副总经理张春湃出席大会并以《百度可信数据空间解决方案—数智驱动价值流通新范式》为题发表主旨报告,分享了百度智能云在数据要素与人工智能融合发展方面的思考与实践。

16830830.jpg

张春湃

百度智能云政务行业副总经理

演讲主题:百度可信数据空间解决方案—数智驱动价值流通新范式

张春湃表示,当前正值可信数据空间技术发展的重要节点,数据的发展与人工智能与大模型产业的发展紧密联动,相互关联,互相依托。他引用2025年Gartner发布的AI大模型技术成熟曲线指出,AI Ready Data(高质量数据集)与AI Agent(智能体)已成为新的热点。他认为,要打通数据流通,需将原始数据的采集、标注、训练与AI智能体应用场景联动,这或许是未来探索数据流通产生价值的良好切入与模式。

回顾我国数据要素发展历程,他提到从早期打破数据孤岛、构建数据池与数据库,到数字经济与数据要素行动计划推进,数据要素流通仍面临诸多挑战。尤其在政府及公共领域,多模态数据集难以有效转化利用,数据处理依赖人工、自动化程度低,数据质量与效率不足等问题突出。此外,数据确权、流通形态与价值体系构建仍是行业共同关注的议题。张春湃强调,当前需聚焦在现有框架下,通过技术手段完善整个数据要素流通。

针对这些情况,张春湃分享了百度的思考:数据汇聚已成为行业共识,但从“数据囤积”转向“智能输出”,打造全链路高质量数据集建设能力,释放数据价值,是数据要素流通中需探索的关键问题。他表示,百度认为相关业务可分为四个方向:一是构建数据流通的“信任基石”,提升数据共享与流通;二是提升基础数据供给数量与质量;三是打造智能化高质量数据集建设工具与服务能力;四是提升数据应用创新能力和效率。

基于上述思路,百度提出以人工智能智算驱动数据价值流通的模式。张春湃表示,该模式将传统关系型数据库与城市视频、政府文本等非结构化数据结合,经多模态数据治理、清洗转换后,通过可信数据链接形成高质量标注集。流通中需平衡数据提供方安全、运营方效率及使用方业务应用需求,未来还将探索如何在大模型环境下高质量数据集快速应用,及与AI Agent场景的联动。

百度可信数据空间架构以算力为基础,结合数据仓库、数据湖与多模态治理能力,通过可信运营管理形成数据资产,并构建行业知识中枢,支撑政务等多领域应用。在安全方面,百度通过数据保险箱、隐私计算、数据沙箱及大模型安全加固,构建端到端的数据安全基座,并与国家相关部门在自主可控、国产适配等领域持续合作。

在数据供给与预处理方面,张春湃指出,传统数据要形成高质量数据集,需依托人工标注与平台能力。百度则在自动驾驶、百度搜索业务中积累了核心的数据梳理与平台能力,在全国布局了20余个数据标注平台。同时,通过行业知识库与API服务,实现数据与模型应用的深度联动,提升数据在政务、企业等场景中的实用价值。

最后,张春湃总结道,百度可信数据空间建设依托四大核心能力——全链路端到端能力、强大的数据处理能力、深厚的行业服务经验积累以及开放的技术架构和生态支持,致力于联合多方合作伙伴,为政府及数据集团提供开放式平台,推动实现数据“供得出、流得动、用得好、保安全”的良性循环,助力数据要素在人工智能时代真正释放价值。

(以上内容根据2025可信数据空间推进大会嘉宾发言整理而成,未经嘉宾本人审阅。)