
8 月 12 日消息,在本周一的 SIGGRAPH 大会上,英伟达推出了一系列面向机器人开发者的全新世界 AI 模型、库及其他基础设施,旨在助力机器人开发领域的创新与发展,其中最引人注目的当属 Cosmos Reason 模型。
Cosmos Reason 是一款拥有 70 亿参数的 “推理” 视觉语言模型,专为物理 AI 应用和机器人设计。它依托自身的记忆和对物理原理的理解,能够赋予机器人和 AI 智能体 “推理” 能力,使其可以 “作为规划模型,推断具身智能体接下来可能采取的步骤”,该模型可用于数据策划、机器人规划和视频分析。英伟达披露,公司内部的机器人和自动驾驶团队正使用这个模型进行数据整理与过滤、标注以及 VLA(视觉语言动作)后训练,VAST Data、Milestone Systems 也在交通监控自动化、视觉检测等领域应用该模型。
除了 Cosmos Reason,现有的 Cosmos 世界模型系列还新增了 Cosmos Transfer-2.该模型能够加速从 3D 模拟场景或空间控制输入中生成合成数据,同时还有一个经过蒸馏、更为注重速度优化的精简版,在速度优化方面表现更为出色。英伟达在发布会上强调,这些模型的主要用途是创建用于训练机器人和 AI 智能体的合成文本、图像和视频数据集。
此外,英伟达还发布了新的神经重建库,其中包含一种渲染技术,开发者可借此利用传感器数据以 3D 形式模拟现实世界。这一渲染能力也被整合进了开源模拟器 CARLA,该平台在开发者中广受欢迎。同时,Omniverse 软件开发工具包也迎来了更新,有助于开发者更高效地构建相关应用。
在机器人工作流程方面,英伟达推出了新的服务器。Nvidia RTX Pro Blackwell Server 为机器人开发工作负载提供了单一架构,而 Nvidia DGX Cloud 则是一个基于云的管理平台,为机器人开发提供了更强大的计算和管理支持。
随着半导体巨头英伟达不断深入机器人领域,这些新发布的产品标志着其在寻找 AI GPU 的下一个重大应用场景方面迈出了重要一步,超越了现有的 AI 数据中心应用,有望为机器人开发领域带来新的变革。
免责声明:本文仅代表作者个人观点,与朝闻天下无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
本网站有部分内容均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责,若因作品内容、知识产权、版权和其他问题,请及时提供相关证明等材料并与我们联系,本网站将在规定时间内给予删除等相关处理.