2024年数据技术趋势：基础模型和机密计算 - 行业新闻

也许塑造当代数据领域的最大力量，就是基础模型的普遍存在。这些模型在生成人工智能的部署中表现得最为明显，其正在影响从外部客户交互到内部员工与数据系统的接口等各个方面。

因此，存储和检索数据、应用和从基础模型中产生价值，以及强调数据驱动流程（如数据安全和数据隐私）的新范式，将在2024年得到巩固。随着先进的机器学习部署继续为我们的生活增添色彩并提供信息，保护数据和确保监管合规性的基本要素将与时俱进，从而使两者的发展受到制约。

智能机器人生成自然语言仅仅是一个开始。为了支持这些人工智能功能，并将其引领至2025年，一个完整的生态系统正在形成。

多模态生成模型

基础模型非常擅长生成文本，以至于人们很容易忘记。根据定义，其擅长处理可以应用的任意数量的任务。因此，组织将在接下来的几个月内开始充分利用这些功能，从而提高生成式人工智能投资的投资回报率。

GPT-4可以无缝集成图像和文本，而且这种轨迹很快就会扩展到其他模式，包括语音、视频、音乐和其他输入，比如传感器数据。聪明的组织将开始探索和试点多模式生成人工智能的用例，这将为营销、数字资产、客户服务等方面产生积极影响。

矢量数据库的胜利

在很大程度上，由于涉及检索增强生成和语义搜索的生成型AI应用的企业基础模型标准化，矢量数据库预计这些功能的价值和采用率将加倍。这些相似性搜索引擎可能最好被视为人工智能检索系统：存储组织拥有的大量非结构化数据，并使用语言模型查询这些数据的最佳方式。

矢量数据库因其在处理高维数据和促进复杂相似性搜索方面的能力，而迅速获得关注。一旦组织确定如何规避在内存中维护矢量数据库索引的潜在成本抑制因素，这些存储库将增强许多用例，包括推荐系统、图像识别、自然语言处理、财务预测或其他人工智能驱动的企业。

生成式人工智能优先考虑个性化

生成人工智能模型在RAG实现和矢量相似性搜索中，经常访问的大量非结构化数据(以前被认为是暗数据)增加了对数据安全和法规遵从性的普遍关注。

2024年的另一个主要趋势是，企业将看到“生成式人工智能专注于特定领域聊天机器人的开发，同时确保组织层面的数据隐私保护。”RAG可以通过确保由生成式AI模型支持的聊天机器人访问经过审查的数据，并包括对数据隐私、法规遵从性和数据安全的控制，来帮助实现这一目标。

机密计算采用率增加

根据其实施方式，机密计算结构可以极大地帮助通过生成AI模型的个性化来加强数据保护。此计算模型涉及将机密数据隔离在安全的CPU飞地中，以便在云中进行处理。这些数据及其处理方法只能由飞地授权的代码访问。

未来一年，预计基于硬件的机密计算的集成将会增加，因为云解决方案会战略性地利用其来吸引隐私和安全需求更高的应用。而这种(机密计算)趋势将在机器学习、金融服务和基因组学等专业领域尤为普遍。

展望