NVIDIA 的 AI-Q 2.0 现已部署在 Oracle 云上,使企业能够利用智能多代理 AI 系统进行研究和任务自动化。
NVIDIA 宣布在 Oracle 云基础设施 (OCI) 上部署 AI-Q 2.0,标志着企业 AI 能力又向前迈进了一步。这种生产就绪的蓝图使开发人员能够构建和操作能够大规模进行复杂推理和任务自动化的智能多代理系统。这一消息发布之际,人工智能在从金融到医疗保健等各个行业的采用加速。
AI-Q 蓝图于 2025 年 4 月推出,是一种专为长期人工智能代理设计的开源参考架构。这些系统采用多代理框架来处理研究、数据检索和工作流程规划等任务。 AI-Q集成了NVIDIA的NeMo Agent Toolkit和LangChain Deep Agents,允许用户通过YAML配置工作流程,而无需重写代码。 2.0 版本添加了增强的部署工具和沙盒环境,以实现安全操作。
OCI 部署亮点
在 OCI 上部署 AI-Q 2.0 利用 Oracle 的 Kubernetes Engine (OKE) 和 Terraform 进行基础设施配置。该蓝图使用多代理架构,其中一个意图路由器将查询定向到浅层研究代理(用于快速、工具辅助的答案)或深度研究代理(用于迭代、多步骤推理)。
主要 OCI 组件包括:
- OKE Kubernetes 集群:托管 AI-Q 的后端、前端和 PostgreSQL 工作负载。
- 负载均衡器:管理 AI-Q 前端的公共入口。
- 保险库:安全地存储 API 密钥和凭据。
NVIDIA 的 GitHub 存储库中详细介绍了部署过程,大约需要 20-25 分钟。开发人员需要具备 Kubernetes、Terraform 和 Helm 的基本知识才能设置系统,其中包括动态资源配置以及与 NVIDIA 的 NGC 容器注册表的集成。
为什么重要
AI-Q 在 OCI 上的部署凸显了对平衡功能与灵活性的企业级人工智能工具不断增长的需求。 NVIDIA 的蓝图允许组织部署基于推理的人工智能系统,该系统能够管理大规模数据并进行引用支持的研究。这使得 AI-Q 成为研究、工业自动化等领域应用的基础。
与更简单的人工智能模型相比,AI-Q 的多智能体设计可实现更复杂的问题解决方法。例如,它可以通过将规划子代理与研究子代理配对来生成详细报告,这两个子代理共享公共文件系统但独立运行。这种模块化对于寻求定制解决方案且无需大量开发开销的企业至关重要。
市场背景
NVIDIA 进军企业人工智能领域的努力符合更广泛的行业趋势。截至 2026 年 6 月 26 日,NVIDIA 的股价为 194.28 美元,反映出投资者对其人工智能计划的信心不断增强。凭借 NeMo 框架以及与 Oracle 等战略合作伙伴关系的支持,NVIDIA 的市值达到 4.74 万亿美元,继续引领人工智能硬件和软件领域。
时机很重要。企业越来越多地从人工智能系统的实验转向大规模部署。通过将 AI-Q 与 OCI 集成,NVIDIA 充分利用了 Oracle 强大的企业客户群,提供可扩展的解决方案,降低了部署高级 AI 工作流程的复杂性。
展望未来
AI-Q 的可扩展性使其成为旨在将人工智能集成到其核心运营中的组织的一个令人信服的选择。基于 YAML 的配置和 NeMo Agent Toolkit 插件系统可实现无缝更新和定制,确保长期适应性。
对于开发者和企业而言,NVIDIA 关于 OCI 部署的指南提供了大规模实施 AI-Q 的清晰路径,为研究、自动化和企业 AI 领域的创新铺平了道路。有兴趣的人可以在 NVIDIA 的官方博客上探索完整说明。
