随着AI与智能制造技术的深度融合,全球机器人产业正从专业化场景应用向通用化服务领域加速迈进,人形机器人作为物理AI的核心载体,成为衡量技术突破的关键标志。在这个过程中,对于复杂环境的动态适应、模糊指令的深度理解、物理仿真与现实世界的精准交互,正在成为制约机器人技术规模化落地的核心挑战。在日前举办的机器人学习大会(Conference on Robot Learning, CoRL)上[9月27日至10月2日,2025 IEEE-RAS第24届类人机器人国际会议(Humanoids)同期举办],收录论文中聚焦物理AI与具身智能突破,围绕移动操作、运动控制、人机交互等核心议题展开深度研究。
“人形机器人是物理AI的下一个前沿领域。”NVIDIA Omniverse与仿真技术副总裁Rev Lebaredian表示:“机器人需要在不可预测的世界中进行推理,适应环境并安全行动。”在本次CoRL大会期间,NVIDIA发布并更新了从机器人研发到应用落地的三大核心工具,包括充当机器人“大脑”的Isaac GR00T,负责对机器人“身体”进行运动仿真的物理引擎 Newton,以及提供机器人“真实训练”环境的Omniverse平台,为机器人技术突破注入关键动力。

图 NVIDIA利用全新开源模型与仿真库加速机器人研发进程
Isaac GR00T:赋予机器人智慧大脑
在本次CoRL大会期间,NVIDIA宣布全新的NVIDIA Isaac GR00T N1.6开源基础模型,即将登陆 Hugging Face平台。其核心突破在于集成了专为物理AI设计的Cosmos Reason 视觉语言模型,使机器人首次具备基于常识与物理原理的深度推理能力。不同于传统机器人需依赖精确指令的运行模式,该模型能像人类一样解读模糊指令,将“整理桌面”这类抽象需求拆解为“识别杯子→判断位置→规划抓取路径→避免碰撞”等可执行步骤。
Isaac GR00T N1.6 采用多模态输入架构,可同时处理语言指令与视觉信息,实现移动与操作的协同控制。其躯干与手臂控制算法的优化,使机器人获得更大活动自由度,能够完成推开重物等复杂任务。在技术适配性上,该模型支持利用Hugging Face平台上的开源 NVIDIA物理AI数据集,对NVIDIA Isaac GR00T N系列模型进行后训练。该数据集包含数千条合成及来自真实世界的轨迹数据,目前下载量已超过480万次。
NVIDIA Cosmos Reason作为“大脑”的核心组件,目前在Hugging Face物理推理模型排行榜位居榜首,下载量已超100万次。它不仅具备数据筛选与标注能力,还可用于模型迭代。更重要的是,该模型已通过 NVIDIA NIM 部署微服务实现快速落地,降低了企业级应用的技术门槛。
目前,AeiROBOT、Franka Robotics、LG Electronics 等9家全球领先机器人制造商已启动Isaac GR00T N系列模型的评估工作,采用Isaac GR00T N系列模型来打造通用机器人。
Newton物理引擎:打破仿真与现实壁垒
针对人形机器人关节复杂、动作精细、环境交互多样的特性,NVIDIA联合Google DeepMind、Disney Research开发的Newton开源物理引擎发布测试版本,彻底改变了现有仿真技术精度不足与迁移困难的现状。该引擎基于NVIDIA Warp加速库与OpenUSD框架构建,兼容多种物理求解器,成为全球超过25万机器人开发者的新选择。
凭借 Newton 灵活的设计,以及兼容多种物理求解器的能力,开发者现在可以对非常复杂的机器人动作进行仿真,例如在雪地或碎石路面行走、操控杯子和水果等,并且能够成功地将这些动作部署到现实场景中。
包括北京大学、苏黎世联邦理工学院机器人系统实验室及慕尼黑工业大学在内的众多知名高校,以及机器人技术公司光轮智能,仿真引擎公司 Style3D 已经率先使用 Newton。
Omniverse平台:成为机器人落地“虚拟练兵场”
作为机器人的“虚拟训练基地”,NVIDIA Omniverse平台的核心竞争力在于物理精准性与工具协同性的统一,使开发者可以无缝衔接CAD设计、仿真训练、部署测试等环节。这种一体化架构,形成了覆盖“数据生成-技能训练-策略评估”的完整工作流。
以机器人领域极具挑战性的任务抓取物件为例,不仅涉及机械臂的移动,还需要将抽象的指令转化为精准的动作,机器人必须通过反复训练才能掌握这项技能。
本次基于NVIDIA Omniverse构建的开发者预览版 NVIDIA Isaac Lab 2.3 新增了灵巧抓取工作流。该工作流通过自动化课程体系,在虚拟环境中对拥有多手指的机器人和机械臂进行调整,从简单任务开始,逐步提升难度。此工作流会调整重力、摩擦力、物体重量等参数,训练机器人在不可预测的环境中也能掌握技能。
即将推出的Isaac Lab Arena评估框架,则解决了仿真测试“场景复杂、标准不一” 的行业痛点。该框架由NVIDIA与光轮智能联合开发,提供大规模实验与标准化测试能力,开发者可在复杂环境组合中验证机器人技能,显著降低测试成本。
值得一提的是,作为合成数据重要来源,NVIDIA Cosmos世界基础模型(WFM)的下载量已超300 万次。本次发布的两大更新进一步强化了其数据生成能力:一方面,Cosmos Predict 2.5整合三款基础模型,支持30秒长视频生成与多视角输出,大幅提升仿真场景丰富度;另一方面,Cosmos Transfer 2.5则将模型体积压缩至前代的 1/3.5,同时提升生成速度与质量,可基于深度信息、分割数据等输入生成高逼真合成数据。
AI基础设施:筑牢机器人研发算力根基
在全球机器人研究的推进过程中,NVIDIA的技术持续提供着重要支撑,CoRL收录的论文中,近半数引用了 NVIDIA 的相关技术,包括 GPU、仿真框架和 CUDA 加速库。这些技术已被卡内基梅隆大学、华盛顿大学、苏黎世联邦理工学院和新加坡国立大学等领先研究实验室及机构广泛采用。本届CoRL还重点展示了斯坦福视觉与学习实验室开展的机器人学习基准测试项目BEHAVIOR,以及由北京大学开发的用于推进基于视觉的触觉机器人研究的高性能仿真平台Taccel。
为了让开发者充分利用这些先进的技术和软件库,NVIDIA还推出了专为高要求工作负载设计的AI基础设施,包括:
● NVIDIA GB200 NVL72:这是一款集成了36个NVIDIA Grace CPU和72个NVIDIA Blackwell GPU的机架式系统。各大云服务提供商已开始采用该系统,以加速AI训练和推理过程,包括复杂推理和物理AI任务。
● NVIDIA RTX PRO服务器:为机器人开发的各类工作负载(包括训练、合成数据生成、机器人学习和仿真)提供统一架构。RAI Institute已采用 RTX PRO 服务器。
● NVIDIA Jetson Thor:搭载Blackwell GPU,能够支持机器人运行多个AI工作流,实现实时智能交互,带来机器人端实时推理功能。这一突破对于高性能物理AI工作负载以及人形机器人等应用具有重要意义。包括Figure AI、银河通用、Google DeepMind、Mentee Robotics、Meta、Skild AI以及宇树科技在内的合作伙伴已采用Jetson Thor。
小结
NVIDIA在本届CoRL大会上的发布,不仅是技术层面的突破,更构建了“模型开源化、仿真精细化、训练标准化、部署高效化”的机器人研发全生命周期创新范式。Isaac GR00T的推理能力、Newton的仿真精度、Omniverse的训练效率与配套基础设施的算力支撑,共同为机器人技术进阶扫清关键障碍。随着全球科研机构与企业的深度参与,势必将进一步加速人形机器人从实验室走向工业、生活等各类场景,开启物理AI的全新时代。