
8 月 15 日消息,智元机器人于 8 月 14 日通过公众号宣布,推出行业首个面向真实世界机器人操控的统一世界模型平台 ——Genie Envisioner(GE)。这一平台的问世,为机器人操控领域带来了全新的技术架构与发展方向。
创新架构:打破传统,实现端到端闭环推理
传统的机器人 “数据 — 训练 — 评估” 模式相互割裂,而 GE 平台创新性地将未来帧预测、策略学习与仿真评估整合进以视频生成为核心的闭环架构。基于 3000 小时真机数据,GE 建立起从语言指令到视觉空间的直接映射,完整保留了机器人与环境交互的时空信息,让机器人能在同一世界模型中完成从 “看” 到 “想” 再到 “动” 的端到端推理与执行,极大提升了机器人的操控效率与智能化程度。
卓越性能:跨平台泛化与长时序任务表现出色
GE-Act 作为平台的关键组件,基于强大的视觉空间预训练,展现出惊人的跨平台迁移能力。在 Agilex Cobot Magic 和 Dual Franka 等全新机器人平台上,仅需 1 小时(约 250 个演示)的遥操作数据,就能实现高质量的任务执行,在跨平台泛化和长时序任务执行方面显著超越现有 SOTA,为具身智能从视觉理解到动作执行开辟了新路径。
开源助力:推动行业发展
智元机器人团队表示,将开源全部代码、预训练模型和评测工具。这一开源举措不仅能促进技术的交流与创新,还能吸引更多开发者参与,加速机器人技术在智能制造与服务领域的应用落地。
未来展望:拓展功能,深化应用
GE 平台的发布,标志着机器人从被动执行向主动 “想象 — 验证 — 行动” 的转变。未来,智元机器人计划扩展更多传感器模态,支持全身移动与人机协作,持续推动智能制造与服务机器人在更多场景的落地应用,为机器人行业的发展注入新的活力。
免责声明:本文仅代表作者个人观点,与朝闻天下无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
本网站有部分内容均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责,若因作品内容、知识产权、版权和其他问题,请及时提供相关证明等材料并与我们联系,本网站将在规定时间内给予删除等相关处理.














