lch
发布于 2026-04-10 / 0 阅读
0

深度|具身界的张雪飞车:具身奥运,中国企业击败最强具身大脑 PI 拿下 3 项第一

据 Z Finance 获悉,在全球具身灵巧操作难度顶尖的真机赛事——Benjie's Humanoid Olympic Games(以下简称Benjie's Olympics)中,来自中国的企业星动纪元凭借自研VLA具身模型,一举斩获该赛事剥橘子、开锁、翻袜子三项任务全球第一

这不仅是中国企业首次在该赛事中登顶,更关键的是,它在三项核心任务中,以显著优势击败了被誉为"全球最强具身大脑公司之一"Physical Intelligence(简称PI)。要知道,此前各项具身智能赛事中PI身影的出现并非主动参与了赛事,而是第三方拿PI开源模型打的成绩,而本次Benjie's OlympicsPI唯一参与的具身赛事,参赛模型为最新闭源模型PI*0.6,也是具身智能领域公认的最强模型。

星动纪元与PI在剥橘子、开锁、翻袜子任务中的成绩对比

  具身灵巧操作奥林匹克,全球最难的具身赛事

Benjie's Olympics由前Google资深机器人专家Benjie Holson发起,初心是提出真正能衡量机器人核心价值的评判体系——即“炫技表演” 走向 “实用落地”。该比赛被科学美国人杂志(Scientific American)认为是机器人终极挑战,直击具身智能的核心命题——莫拉维克悖论:人类习以为常的日常感知与动作(如叠衣服、用钥匙开锁等),对机器人而言是极高难度的挑战。

赛事按难度等级分为金牌任务、银牌任务和铜牌任务,只有每项任务获得第一,才能摘得对应的奖牌。赛事汇聚了PI Sunday Robotics等全球顶尖具身智能公司,这也是PI唯一主动参与的赛事,其参赛所用的闭源模型(π*0.6,代表了PI大脑能力的最高水准,赛事结果反映了当前具身智能领域的最高水平。

  三项任务大幅超越 PI,刷新全球第一纪录

近期,Benjie's Olympics正式宣布星动纪元在剥橘子、开锁、翻袜子三大核心任务中,均以显著优势超越前纪录保持者PI

Benjie's Olympics公布, 星动纪元获两项金牌难度任务(剥橘子、开锁)第一

Benjie's Olympics公布,星动纪元获银牌难度任务(翻袜子)第一

剥橘子(金牌难度任务):「首个无工具纯手剥,比 PI 速度快35%

  • 任务难点:要求机器人精准区分果皮与果肉的细微视觉特征,实时跟踪剥制过程中的果皮形变,要求视觉感知有极高的鲁棒性。

  • PI 成绩:借助削皮刀工具, 246秒完成。

  • 星动纪元成绩:首个实现完全无工具纯手剥操作的团队,纯手剥147秒完成,速度提升35%

开锁(金牌难度任务):「比 PI 速度快 25%

  • 任务难点:钥匙孔为毫米级微小目标,要求机器人精准识别钥匙孔的位置、角度,同时完成钥匙的姿态理解,实现毫米级对准,还需克服光照变化、金属反光、视角偏差等多重干扰,对视觉感知的精度与鲁棒性要求严苛。

  • PI 成绩:66秒完成

  • 星动纪元成绩:49秒完成,速度提升25%

翻袜子(银牌难度任务):「比 PI 样本量少 32%,速度快 30%

  • 任务难点:作为检验模型家用泛化能力的核心标杆,该任务是柔性物体操作、样本泛化、效率敏感的典型场景,袜子翻转过程中会发生复杂、无规律的形变,要求机器人实时跟踪形变,精准区分袜子的内外侧、开口位置,对视觉感知、柔性物体跟踪能力要求极高。

  • PI 成绩:133秒完成,176个样本

  • 星动纪元成绩:比PI速度提升30%120个样本,样本使用量少32%

此次,星动纪元作为唯一上榜的中国具身智能企业,在Benjie's Olympics中斩获三项任务全球第一并刷新世界纪录,这也是星动纪元在具身模型能力上的又一重要成果。

  星动纪元,具身智能界的张雪飞车

2月底,星动纪元陈建宇团队才在世界模型权威测评WorldArena榜单中超越谷歌、英伟达斩获具身任务全球第一。

结合此次,星动纪元1个月拿下4项全球第一,如果长期跟踪星动纪元,说一句具身智能界的 “张雪飞车”不为过。两者都是:长期蛰伏、技术打底、低调深耕、突然爆发、碾压国际一线、以中国力量登顶全球。

在这之前,星动纪元的具身大脑在研究范式、技术引领和应用落地上已经取得:

中国唯一,全球1/4ERA-42已实现全尺寸人形机器人全身及五指灵巧手精准控制;其余三个为Figure Helix,特斯拉Grok及英伟达GR00T

全球首提分频VLA20249月, 推出HiRT快慢分层架构,通过latent向量连接70亿参数世界模型与4000万参数执行模型;202410月到20253月,PIFigureGoogleNVIDIA 相继发布分频VLA

全球首个融合世界模型的具身大脑:202412月,发布融合世界模型的VLA算法框架VPPVideo Prediction Policy,现已开源),将具身智能可用数据扩展至海量互联网视频数据,机器人得以理解“物理世界”,边想边做。

202510月,清华陈建宇团队联合斯坦福 Chelsea Finn团队(PI联创)提出可控生成世界模型 “Ctrl-World” —— 让机器人在 “想象空间” 中完成任务预演、策略评估与自我迭代,将机器人在陌生场景下游任务平均成功率提升了44.7%

20262月,清华陈建宇(星动纪元创始人)团队和斯坦福 Chelsea FinnPI 创始人) 团队基于 Ctrl-World (两个团队的首个合作成果),再度携手,联合提出了 VLAW 框架,首次实现了 VLA 策略与动作条件世界模型的协同迭代优化,让两者形成一个「互相促进的闭环」:

  • VLA 策略采集的真实交互数据,反过来用于提升世界模型的物理保真度;

  • 世界模型生成的高质量虚拟数据,再用于持续强化VLA 策略本身。

目前,具身大脑ERA-42已在物流、制造、商业服务等多个领域落地,形成了“场景越丰富,模型越智能” 的正向循环——在物流领域,可完成药品、日化品、包裹的分拣及扫码;在制造领域,重点突破“零部件抓取 - 高精度装配 - 质量检测” 等场景任务;在商业服务领域,可完成门店客座清洁、物品递送、导游导览等。其中,部分场景效率当前达到70%


加入ZF讨论群,请先添加小助手微信
Image
---------END--------

我们相信认知能够跨越阶层,
致力于为年轻人提供高质量的科技和财经内容。
投稿邮箱:zfinance2023@126.com

稿件经采用可获邀进入Z Finance内部社群,优秀者将成为签约作者,00后更有机会成为Z Finance的早期共创成员。

Image
🚀 我们正在招募新一期的实习生
Image