据报道,智元机器人正式发布了新一代具身基座大模型 Genie Operator-2(简称 GO-2)。该模型的核心使命是彻底打通从“逻辑推理”到“精准动作执行”的最后一公里,让机器人不仅能听懂指令,更能稳定地完成任务。

image.png

核心黑科技:首创“动作思维链” (Action Chain-of-Thought)

GO-2引入了一种全新的交互逻辑,彻底改变了机器人的思考方式:

  • 拒绝“边看边做”: 不同于传统模型直接输出控制信号,GO-2会先在脑海中生成一段高层动作序列,作为任务的整体规划。

  • 想清楚再动: 通过这种结构化的中间表示,机器人实现了从“感知输入”到“动作空间推理”的跨越。相关技术成果已被 AI 顶级会议 CVPR2026 接收。

架构革新:异步双系统确保“执行不跑偏”

为了解决机器人执行过程中的稳定性问题,智元构建了一套精密协同的异步体系:

  • 慢系统(智囊): 以低频运行,持续输出具备长程逻辑的动作规划“意图流”。

  • 快系统(肌肉): 以高频运行,实时对齐慢系统的规划。当遇到桌面高度偏差或物体滑动时,快系统会进行瞬时修正,确保最终动作贴合预设轨迹。

战绩彪炳:多个基准测试刷新 SOTA 纪录

在多项衡量具身智能实力的权威测试中,GO-2展现出了统治级的表现:

  • LIBERO Benchmark:平均成功率高达 98.5%,在四类核心任务中均排名全球第一

  • Genie Sim3.0:在仅使用仿真数据训练的情况下,真实环境测试成功率达 82.9%,显著优于竞对模型(如 π0.5)。

产业愿景:从“实验室”走向“生产线”

智元机器人不仅仅发布了一个模型,更构建了一套闭环的学习体系:

  • 分布式进化: 依托Genie Studio平台,模型能在真实环境中持续采集交互数据并在线优化,实现“越用越聪明”。

  • 通用大脑:GO-2的目标是成为具身智能的通用大脑,助力机器人从虚拟仿真平滑过渡到复杂的产业落地场景。

结语:开启“知行合一”的机器人时代

正如智元官方所言,具身智能的终极追求是理解与执行的统一。随着 GO-2 的落地,机器人正在从只会纸上谈兵的“思考者”,进化为能够精准改变物理世界的“实干家”。