NVIDIA 的 BEVPoolV3 大幅缩短了 GPU 上 BEV 池化的延迟,推动自动驾驶汽车、机器人和空间 AI 系统的发展。
NVIDIA 利用全新 BEVPoolV3,推出了适用于自动驾驶汽车 (AV)、机器人和空间 AI 的鸟瞰 (BEV) 池化技术的重大进展。此更新大大减少了 NVIDIA GPU 上的延迟,从而支持轨迹预测和地图绘制等应用程序的实时处理,这是下一代自主系统的关键推动因素。
BEV 池化通过将多个摄像头的数据整合到统一的自上而下的空间网格中来简化感知。然而,由于其分散归约操作、不规则的内存访问模式以及 GPU 特定的缓存限制,它历来都面临着性能瓶颈。 NVIDIA 的 BEVPoolV3 消除了许多此类低效率问题,与前身 BEVPoolV2 相比,速度提升高达 42 倍,具体取决于硬件和配置。
BEVPoolV3 有什么新功能?
BEVPoolV3 引入了四项关键优化:
- 减少多余的深度载荷
- 用于高效索引的五数组 INT32 散点图
- 预计算索引以删除运行时整数除法
- 间隔拥有的输出写入,避免原子操作
这些更改使 BEVPoolV3 能够适应不同的 GPU 内存机制。例如,在具有较小的 6 MB L2 缓存的 NVIDIA RTX A6000 上,该算法侧重于减少 DRAM 流量。在具有 128 MB 二级缓存的 RTX PRO 6000 Blackwell Max-Q 上,优化优先考虑指令效率和 FP8 处理,在规范配置中提供仅为 16.4 µs 的中值延迟。
对自治系统的影响
纯电动汽车池对于自动驾驶汽车和机器人技术至关重要。它使系统能够实时推理车道、车辆、行人和可用空间。通过大幅缩短延迟,BEVPoolV3 增强了这些应用中使用的人工智能模型的响应能力,为更安全、更高效地部署自主车队铺平了道路。
对基于池的技术的商业兴趣正在增长。 Waymo 和 Uber 等公司正在大力投资由人工智能驱动的池化算法支持的电动自动驾驶车队。例如,Waymo 最近推出了 Ojai 机器人出租车,并宣布计划将废旧电动汽车电池重新用于电网规模的能源存储。与此同时,Uber 已承诺投资 1 亿美元为其电动机器人出租车建设电动汽车充电基础设施。 NVIDIA 在 BEV 池化技术方面的进步符合这些行业趋势,为可扩展、高效的自主移动系统提供了基础。
性能和实际应用
NVIDIA 的基准测试突显了 BEVPoolV3 对运营效率的巨大影响。在 RTX PRO 6000 Blackwell Max-Q 上,具有更宽通道数和更大点集的配置比 BEVPoolV2 加速高达 42 倍。这种性能飞跃对于现实世界的应用程序至关重要,例如:
- 自主按需出行 (AMoD) 网络中的拼车算法
- 仓库自动化和配送系统中使用的先进机器人
- 智能城市和基础设施监控中的空间 AI
此外,NVIDIA 使用 Nsight Compute 等工具确保这些优化可以在其他聚集/分散繁重的工作负载上复制,包括体素化和稀疏嵌入。
展望未来
随着自主系统在 2026 年及以后规模扩大,池化算法、电池管理和基础设施之间的相互作用将决定行业领导者。 NVIDIA 的 BEVPoolV3 使该公司成为该生态系统的关键推动者。开发人员现在可以使用 NVIDIA 的 TensorRT 插件将这些优化应用到自己的工作负载中,从而将效率和可扩展性提升到新的水平。
纯电动汽车共享技术的广泛采用凸显了其在重塑城市交通、减少排放和整合能源系统方面的变革潜力。随着 GPU 加速人工智能的不断发展,NVIDIA 的创新正在为实时空间智能设定标准。
