机器人前瞻(公众号:robot_pro)
作者|葛文婷
编辑|漠影
机器人前瞻4月3日报道,当地时间4月2日,美国AI机器人公司Generalist AI发布了最新具身基础模型—— GEN-1。
GEN-1基于50万小时预训练数据,不仅把任务平均成功率从上一代模型的64%提升至 99% 、将机器人工作速度提高了近 3 倍、还能能够让新任务的适配数据需求大幅降,仅需1小时机器人数据就能完成单项训练任务。
Generalist AI由前谷歌DeepMind高级研究科学家 Pete Florence 创立,核心团队汇聚了来自波士顿动力、OpenAI、Waymo等顶尖公司的资深研究人员。该公司致力于“让通用机器人成为现实”,目前已获得英伟达旗下风投机构NVentures、Spark Capital、Boldstart Ventures、Bezos Expeditions以及NFDG等知名机构的投资,估值突破3亿美元(约合人民币20亿元)。
值得注意的是,距离其推出第一代基础模型GEN-0,才过去 不到半年 。
一、1小时数据即可训练机器人完成单项任务,预训练数据超50万
GEN-0是该公司推出的第一款专注于多模态训练的基础模型,它的出现首次证明了机器人领域同样遵循 scaling law ,并验证了机器人通用化、规模化提升的可行性,但当时该模型的表现尚未达到商用标准。
而如今的GEN-1是Generalist AI在机器人学习扩展领域的最新成果,相较于GEN-0,GEN-1在 任务执行速度 、 成功率 、 处理效率 、 应变能力 以及 训练数据集 五个维度上均实现了显著跨越:
1、 速度倍增 : GEN-1的执行速度达到GEN-0的三倍。
2、 成功率质变 : 任务平均成功率由64%大幅提升至99%。
3、 效率优化 : 训练机器人完成单项任务仅需1小时机器人数据。
4、 应变能力强 : 具备意外情况下的自我恢复能力,展现出一定的临场应变能力。
5、 数据扩容 : 预训练数据从之前的27万小时扩展到50 万小时高保真操作,涵盖全球数千个家庭、仓库、工厂、面包店、自助洗衣店等场景,数据运营每周新增超过 1 万小时。
在测试中,GEN-1无需人工干预,便能长时间稳定完成多项任务,包括:
- 持续1小时以上 的汽车配件分拣;
- 连续折叠 86件 T恤;
- 连续完成 200余次 扫地机器人维护;
- 连续完成 1800余次 积木装箱;
- 连续折叠纸箱超过 200次 ;
- 连续打包手机超过 100次 等。
上述任务的 成功率均突破了99% 。
其中,在维护扫地机器人任务中,GEN-1 平均成功率达到 99% ,而 GEN-0 仅 50% ;折叠纸盒任务上,GEN-1 达到 99% ,而GEN-0为 81% ;在手机装盒任务上,GEN-1 达到 99% ,GEN-0 为 62% 。作为对比, 没有经过预训练的GEN-0,平均成功率只有 19% 。
▲GEN-1、GEN-0和未经训练的GEN-0在维护扫地机器人任务中的平均成功率
▲GEN-1、GEN-0和未经训练的GEN-0在折叠纸箱任务中的平均成功率
▲GEN-1、GEN-0和未经训练的GEN-0在打包手机任务中的平均成功率
二、工作速度提升3倍,还能随机应变处理突发意外
在速度上,GEN-1 打破了机器人领域长期存在的“速度屏障” 。
以折叠纸盒为例,GEN-0及同期其他模型(如π0)耗时约 34秒 ,而GEN-1将这一时间压缩至 12秒 , 速度提升2.8倍 。在手机装盒任务中,GEN-1仅需 15.5秒 ,同样是GEN-0的 2.8倍 ,任务完成速度达到行业最优水平的 3倍 左右。
更关键的是,GEN-1的作业速度已超越人类演示水平,能在高速状态下精准适配物体的物理特性,并做出实时响应。
据悉,GEN-1速度突破的核心支撑源于 三大技术协同 :
1、 经验学习(RL) : 模型通过经验迭代自主优化动作效率,实现高速执行。
2、 Harmonic Reasoning推理架构升级 : 全新的推理架构大幅提升了实时决策效率。
3、 高质量预训练数据 : 通过低成本可穿戴设备采集海量人类行为数据进行训练,实现知识迁移。
另外,GEN-1的另一大亮点在于其 “随机应变”能力 :
当工作中遇到突发意外(如分拣时零件被撞歪),GEN-1也不会傻傻地僵在原地等待人工调试,而是 能自主选择多种应对方案 ,例如将垫片放回重抓,或借助卡槽将歪斜的零件复位。面对更复杂的情况,它甚至能调用另一只手实现双手协同,顺利完成工作。
▲GEN-1可以自主处理突发意外
▲GEN-1可以协同双手完成复杂任务
这种能力让GEN-1能够灵活面对各种超出训练范围的突发行为,有效解决各类长尾问题,保障任务的稳定推进。
结语:GEN-1并非完美无缺,GEN系列的研发之路仍任重而道远
GEN-1将任务平均成功率从64%提升至99%,标志着通用智能机器人在灵巧操作领域取得了重大突破。
不过需要强调的一点是 :GEN-1 并非完美无缺。
我们需要清楚的认识到,尽管GEN-1在多项灵巧操作任务中已实现99%的成功率, 但它并非所有的测试任务都能达到这一水准 ,在部分工业落地场景中,模型仍需更高的成功率与执行效率才能实现实用化部署,这些都是当前版本亟待补强的短板。
对此,Generalist AI 团队已明确研发方向并展现出充足信心,他们将致力于让下一代模型解锁更广泛、更复杂的任务能力,并持续优化模型结构,进一步降低机器人单项任务的数据需求。