深度分析 | 人工智能在数据安全领域的应用探析

时间:2024-08-27
作者: 艾龙

前言

全球数字经济的背景下,随着产业的不断发展,各种新技术、新产业和新模式也在此基础上不断地涌现,人工智能技术也在不断地优化和迭代,在各行业各领域取得了广泛运用,通过数字经济的推动使得数据成为了一项全新的生产要素[1]。随着人工智能在数字经济、数字产业中的不断应用和优化,数据也得到了充分地开发和利用,使得数据成为各行业的核心驱动力,从驱动个性化服务到优化操作流程,它贯穿于决策制定、产品创新、客户服务和效率提升的各个环节。各行业对数据的依赖程度之高前所未见。数据在不同的主体、不同的场景下以不同的形态在不断地流转与智能应用,随之带来的数据泄露、数据破坏、数据违法违规使用等等各类数据安全事件也是层出不穷。近年来,随着我国《网络安全法》《数据安全法》《个人信息保护法》的相继出台,数据安全逐渐成为国家安全的重要组成部分,关系到国家主权的稳固及社会经济的发展。所以,在人工智能时代,数据安全已成为必修课,是需要全社会共同面对和解决的关键问题。

一、人工智能技术概述

人工智能正加速发展,且广泛应用于社会生活的方方面面,从生物特征识别、计算机视觉、人机交互、机器学习、知识图谱、自然语言处理到大模型的应用,人工智能不断推动着行业革新和产业升级。生物特征识别技术使得设备更安全、个性化,广泛应用于智能手机解锁、机场安检等场景。计算机视觉技术让机器能够理解和解释视觉信息,在新能源汽车自动驾驶和医疗诊断中的影像分析等场景下得到了显著的应用效果。人机交互技术的进步使智能设备的使用体验更加友好,如通过语音助手和自动翻译工具打破语言障碍、通过手势和情感识别等技术使得人机交互更加自然。机器学习在数据分析和预测中占据核心地位,从金融风控到智能推荐系统,其应用无处不在。知识图谱帮助机器理解和组织海量信息,可用于改进搜索引擎和智能问答系统。自然语言处理使计算机能更流畅地理解人类语言,广泛应用于聊天机器人和语音识别分析系统。最近,大模型的应用推动了这些技术的融合与创新,如生成式预训练变换器模型在文本生成、图像识别等多模态任务中展现出了惊人能力。这些技术的结合和交叉应用不仅扩展了人工智能的边界,也为我们解决更多复杂问题提供了可能,标志着人工智能正逐步成为现代社会不可或缺的一部分,为我们的生产和生活提供了诸多创新和便利[2]。AI

二、人工智能在数据安全中的双刃特性

人工智能既能推动经济社会发展,也会带来各种类型的安全风险,是一把双刃剑[3]。伴随着人工智能的不断应用,使得其在网络安全领域的风险也日益凸显,尤其是数据安全问题,需要引起大家的高度重视。一是人工智能应用的合法合规问题,不法商家可利用人工智能技术对消费者进行价格欺诈、虚假宣传、诱导消费、侵犯隐私等违法行为。犯罪分子可利用人工智能技术实施生物特征伪造、精准诈骗、智能驾驶攻击等犯罪行为。二是人工智能得发展需要大量的数据来训练和优化模型,一旦数据在采集或处理过程中遭受到篡改、破坏和滥用,会对人工智能的性能和可信度产生不可预见的影响。三是人工智能降低了安全攻击的门槛,使得安全攻击方式更加多变、攻击频次更高、攻击行为更加精准,进一步加剧了数据安全风险。

640 (1).png

图1人工智能在数据安全领域的双刃剑效应

正因为人工智能具有双面性,过分放大其优点或者弊端都是不可取的,各行业各领域在进行创新应用时都应当先充分理解人工智能的双重性质(如图1)。人工智能的高速发展加剧了数据安全风险,数据安全亦是人工智能健康发展的关键保障,利用人工智能又能全面提升数据安全的综合能力。我们需要采用辩证和积极的心态来理解人工智能时代的数据安全保障工作,在全面分析数据安全风险的基础上,充分挖掘数据安全管理和技术等各方面的智能化需求,再合理利用人工智能来使得数据安全保障工作更加高效、有序。

三、数据安全领域下的智能化需求

数据安全是一项体系化、持续性、需要多角色协同参与的复杂工程,从规则、建设、使用的视角来看,数据安全工程内容包含战略方针制定、管理体系建设、技术能力建设、持续安全运营等主要环节。在战略方针制定阶段,需要结合合规政策要求、业务发展需求、风险控制需求、技术创新需求等各方面信息和情报,进行分析和决策,明确数据安全工作的目标和路径。在管理体系建设阶段,面对多角色的协同机制、复杂的数据安全合规要求、业务场景下的数据安全风险,需要制定涵盖从战略方针、管理要求、规范指导、执行过程的制度文件体系,且需要定期更新和优化[4]。在技术能力建设阶段,需要考虑如何利用成熟稳定的数据安全技术来实现数据全生命周期过程的有效管控和保护,其中还需要重点考虑新技术和新架构与传统方案的融合。在持续安全运营阶段,需要遵循管理要求和流程,利用技术工具,围绕数据处理活动的全生命周期开展数据安全识别、防护、检测、响应和恢复等常态化事务。结合以上数据安全体系工程各环节的主要工作内容,综合分析来看,数据安全工作的难度和挑战,可以从四个方面进行分析。一是数据识别与梳理的挑战。数字经济生态下的数据规模大、且类型繁多,依赖传统工具结合人工梳理、盘点的治理方式已无法满足当今数据应用的需求。二是数据处理活动监测的挑战。随着数字化转型的深化,企业业务的深度融合,各业务活动的融合和协同,使得数据应用和流转更加频繁,数据面临的各类处理活动更加丰富和多元,依靠传统的监测和分析技术已经无法全局感知数据的分布和流转态势。三是数据安全保护效率和准确性的挑战。面临大规模、不断流转和变化的数据,随之而来是不断变化和升级的数据安全威胁,如何利用新技术、新架构来降低各类数据安全威胁利用脆弱性的可能性,并将风险的影响程度控制到最低,是当前需要重点关注的问题。四是数据安全日常管理的挑战。例如数据安全管理体系的制定和维护、数据安全监督检查、数据安全审计评估、数据安全考核评价等管理事务,涉及到对上级多层级法律政策和监管要求的衔接,也涉及到与业务管理、数据管理、传统网络安全管理工作的协同和配合,如何利用人工智能技术提升数据安全管理的协同效率,提升管理过程中的文案编制效率也是需要面临的重要挑战。AI

四、人工智能在数据安全领域的应用

面对人工智能时代下的复杂数据安全问题,本文认为其破局关键便是通过人工智能全面赋能数据安全管理和技术的各个环节,通过各类人工智能技术与传统解决方案的融合,构建智能化的数据安全体系。本文认为可以从下述几个方面展开数据安全智能化的建设。(一)数据安全决策辅助

通过人工智能技术从海量合规政策、威胁情报、行业动态、最佳实践中快速识别和学习规律,从中挖掘和分析出有价值的信息,并进行智能化的决策分析,为领导层针对性的提供适合组织合规监管、业务发展、风控防范所需的数据安全方针和策略。在合规政策分析方面,自然语言处理技术能够自动解读和比较法律法规文本,帮助企业快速了解政策变化并保持合规。其次,威胁情报分析中,机器学习和数据挖掘技术协同工作,通过分析历史威胁数据识别模式,预测未来可能的威胁趋势。在行业动态分析方面,机器学习用于梳理和分析行业报告和新闻,提供市场趋势的定量预测。最后,在最佳实践分析过程中,知识图谱技术能够将不同来源的最佳实践知识整合起来,形成易于查询的知识库,以支持决策制定。可以通过人工智能在安全战略规划中提供全面的分析和决策支持,从而提高了规划的效率和质量。

(二)数据安全智能评估

数据安全评估过程中,涉及到问卷调查、人员访谈、文档查阅、配置查验、旁站验证、技术检测、专家分析、编制报告等多个步骤,要求评估人员具备丰富的专业知识和实践经验,且每个环节都需要投入大量人力。将人工智能技术应用到数据安全评估过程中,一方面可以降低实施人员技术门槛,另一方面也能极大程度提升评估过程的效率和质量。实现智能评估的过程中,主要采用自然语言处理、机器学习、知识图谱等技术。首先,通过知识图谱构建动态更新的评估指标知识库。其次,利用机器学习和自然语言处理生成调研问卷。然后,利用流程自动化技术,能够按照预设的逻辑自动下发问卷,确保信息收集的及时性和规范性。接着,通过智能填报技术,可实现对调研信息的智能识别和自动填充,能够准确解析问卷内容并辅助工作人员快速完成信息录入。最后,通过数据整合分析技术,自动对收集到的信息进行清洗、分类和汇总,自动生成评估报告,并利用机器学习算法模型挖掘数据间的关联和趋势,为后续的风险分析提供科学、精准的数据支撑。

(三)智能制定数据安全制度

数据安全合规管理过程中面临着来自国家、地区、行业等多层次不同维度的监管,企业在建立数据安全管理体系时,需要以合规为基线,衔接各方面监管要求,将数据安全责任与义务转化为企业的数据安全管理内容。在合规政策的汇编、责任事项的分解、工作任务的分配、安全要求的设计等方面需要投入大量人工开展文案工作。在人工智能时代下,应当利用自然语言处理、机器学习等技术来提升写作效率和质量,可以利用词法分析、实体抽取、实体链接、语言模型等自然语言处理技术来解析各类合规政策文件,提取责任义务相关条款。进一步通过利用语言模型、词法分析、语义相似度等技术,建立企业内部数据安全管理要求与法律法规、行政法规、部门规章、地方规章、技术标准等文件之间的关联关系,当这些文件发生变化时,可以自动化提示管理人员,并给出修改建议,不断更新和维护企业数据安全管理体系。

(四)智能预测数据安全风险

人工智能技术可以通过大规模数据分析,准确地识别和预测各类数据安全风险。首先,需要选择选取可解释性强的深度学习模型,为实现有效识别数据安全风险的目的,可以采取可解释的卷积神经网络、胶囊网络、神经网络决策树等方法[5]。其次,对特征分量进行识别与提取。然后,构建基于语义的数据处理活动行为风险知识库,通过对网络流量、应用日志、安全日志数据等信息进行实时监测和融合分析,自动识别异常行为和恶意攻击等数据安全威胁,预测可能发生的数据安全风险。

(五)智能识别敏感数据

通过机器学习、自然语言处理技术识别数据集中的关键信息和模式。首先,可以收集包含企业各类数据的训练集,对每个样本进行标记,为后续模型训练提供基础。然后,从原始数据中提取关键特征,以便机器学习算法更好地理解数据。接着,基于自然语言处理技术对数据内容进行处理后,进行特征匹配后选择适当的算法。最后,通过训练集对选定的算法进行反复训练,系统学习以后会提炼出这些文件的共同点生成敏感数据模型,将经过训练和评估的模型部署到实际应用中,用于实时监测和识别敏感数据。

(六)数据安全智能管控和保护

数据在全生命周期视角下需要通过访问控制、脱敏、加密等等一系列安全措施进行管控和保护,然而在应对大规模的数据体量、密集的流动频次、多样化的数据种类,安全措施在实施前,会面临大量的数据梳理、场景分析、风险分析和安全规则设计工作,有效利用人工智能技术能够大幅提升数据安全管控和保护工作效率和准确性。一是可以通过生物特征识别技术加强数据处理过程中的身份鉴别的安全性和效率。二是可以基于自然语言处理、和机器学习技术实现数据的智能脱敏和脱敏效果的智能检测。三是可以通过隐私计算技术体系中的联邦学习技术,确保在数据处理和机器学习过程中的数据安全保护。四是通过人工智能技术实现数据安全保护策略、数据安全组件规则的智能联动。首先,基于自然语言处理对数据安全保护策略进行解析和学习,结合角色、场景、数据、操作的标签属性定义,生成各类数据安全组件的推荐配置。然后,通过基于机器学习技术持续动态关联数据安全风险的监测和预测结果。在智能响应数据安全风险事件的同时,结合对安全组件历史配置数据和设备性能分析,动态更新和维护安全组件配置规则。

(七)数据安全行为智能考核

在安全受控的关键场所内,部分单位已经通过采用计算机视觉、人机交互技术、自然语言处理等人工智能技术,实现了对工作人员的日常交流、语音通讯、即时聊天、数据处理、网页浏览、邮件收发等场景的监测与分析。同时,这些单位还通过机器学习算法考核并预测可能存在的数据泄露风险,并对潜在风险的工作人员及时开展教育和辅导。这不仅提升了工作人员的安全意识、建立了企业安全文化,也极大地降低了数据泄露的安全隐患。AI

五、展望

随着人工智能技术的不断演进,在网络及数据安全领域,未来将呈现出机器对机器的网络安全攻防对抗场景,表现为智能攻击和智能防御的博弈。攻击方将能够利用人工智能技术自动搜寻系统的弱点并发起快速且精确的攻击,而防御方则能够即时识别这些攻击模式,并自动部署相应的防御措施进行拦截和修复。此情形下安全防御关键点在于要利用人工智能技术去构建持续学习和自适应变化的关键能力,以长效的智能化安全能力来扩大防御方优势。防御系统不仅要能够学习已有的攻击特征,还要具备应对全新攻击威胁的能力。此外,网络及数据安全产业生态的有效协同也至关重要,通过共享情报和资源,协同形成一个互联互通的强大防御网络,从而来提高整个智能化生态系统的安全性与韧性。同时,制定前瞻性的政策和法规,确保人工智能技术的伦理使用,也是保障安全的重要环节。

参考文献

[1]王敬勇,华雨倩.数字经济时代下企业数据安全面临的挑战及应对——以滴滴为例[J].当代经济,2023,40(3):12-18.[2]袁云佳.人工智能的发展与应用综述[J].科技风,2020(17):25-26.[3]吴沈括,石嘉黎.数据安全视域下的人工智能风险应对研究[J].西北工业大学学报(社会科学版),2019(2):95-103.[4]艾龙.数据安全管理职责划分和追责机制探析[J].信息安全研究,2023,9(1):73-78.[5]贾晓旭.基于可解释人工智能的数据安全风险识别研究[J].信息系统工程,2024(1):50-54.s(本文作者:天融信科技集团股份有限公司 艾龙)