在近期的博客文章中,Rackspace公司分析了许多读者都熟悉的瓶颈问题:混乱的数据、不明确的所有权、治理缺口,以及模型投入生产后的运行成本。该公司通过服务交付、安全运营和云现代化的视角来审视这些问题,这表明了其自身的努力方向。
Rackspace内部运营AI最清晰的例子体现在其安全业务中。1月下旬,该公司将RAIDER(Rackspace高级智能、检测和事件研究)描述为专为其内部网络防御中心构建的定制后端平台。在安全团队面对大量警报和日志的工作环境中,如果依赖手动编写安全规则,标准检测工程就无法扩展。Rackspace表示,其RAIDER系统将威胁情报与检测工程工作流程统一,使用AI安全引擎(RAISE)和大语言模型来自动化检测规则创建,生成符合MITRE ATT&CK等已知框架的"平台就绪"检测标准。该公司声称已将检测开发时间缩短了一半以上,并减少了平均检测和响应时间。这正是重要的内部流程变革。
该公司还将智能体AI定位为消除复杂工程项目摩擦的方式。1月份一篇关于在AWS上现代化VMware环境的文章描述了一种模式,其中AI智能体处理数据密集型分析和许多重复性任务,同时将"架构判断、治理和业务决策"保留在人类领域。Rackspace将此工作流程定位为防止高级工程师被边缘化到迁移项目中。文章指出,目标是将第二天运营纳入范围,这是许多迁移计划失败的原因,因为团队发现他们已经现代化了基础设施,但没有现代化运营实践。
在其他方面,该公司描绘了AI支持的运营图景,其中监控变得更具预测性,常规事件由机器人和自动化脚本处理,遥测数据(加上历史数据)用于发现模式,进而推荐修复方案。这是传统的AIOps语言,但Rackspace将此类语言与托管服务交付联系起来,表明该公司使用AI来降低运营管道中的劳动成本,这是除了AI在面向客户环境中更熟悉的使用之外的补充。
在描述AI启用运营的文章中,该公司强调了重点策略、治理和运营模式的重要性。它明确了工业化AI所需的机制,比如根据工作负载是否涉及训练、微调或推理来选择基础设施。许多任务相对轻量,可以在现有硬件上本地运行推理。
该公司注意到AI采用的四个重复障碍,最显著的是分散和不一致的数据,并建议投资集成和数据管理,以便模型有一致的基础。当然,这不是Rackspace独有的观点,但技术优先的大型参与者如此明确地表达这一点,说明了许多企业级AI部署面临的问题。
规模更大的公司微软正在努力协调自主智能体在各系统中的工作。Copilot已演变为编排层,在微软的生态系统中,多步骤任务执行和更广泛的模型选择确实存在。然而,值得注意的是,Rackspace指出微软的一个事实:只有当身份、数据访问和监督牢固地融入运营中时,生产力收益才会到来。
Rackspace的近期AI计划包括AI辅助安全工程、智能体支持的现代化和AI增强的服务管理。其未来计划或许可以从该公司博客1月份发布的一篇关于私有云AI趋势的文章中看出端倪。在该文章中,作者认为推理经济学和治理将推动架构决策直到2026年。它预期在公有云中进行"突发性"探索,同时基于成本稳定性和合规性考虑,将推理任务转移到私有云中。这是一个基于预算和审计要求而非新颖性的运营AI路线图。
对于试图加速自己部署的决策者来说,有用的启示是Rackspace将AI视为一门运营学科。它给出的具体、公开的例子是那些减少可重复工作中周期时间的例子。读者可能接受该公司的方向,但仍要警惕该公司声称的指标。在不断发展的业务中需要采取的步骤是:发现重复流程,检查由于数据治理而需要严格监督的地方,以及通过将一些处理引入内部可能降低推理成本的地方。
Q&A
Q1:RAIDER系统是什么?它在安全运营中有什么作用?
A:RAIDER是Rackspace高级智能、检测和事件研究系统,是专为内部网络防御中心构建的定制后端平台。它统一威胁情报与检测工程工作流程,使用AI安全引擎和大语言模型自动化检测规则创建,将检测开发时间缩短了一半以上。
Q2:Rackspace如何使用AI智能体进行云现代化?
A:Rackspace使用AI智能体处理数据密集型分析和重复性任务,同时将架构判断、治理和业务决策保留给人类。这种模式防止高级工程师被边缘化到迁移项目中,确保第二天运营实践也得到现代化。
Q3:企业部署运营AI面临哪些主要障碍?