lch
发布于 2026-05-26 / 0 阅读
0

1台轮式人形机器人,1家企业的10年战略定力

加入高工机器人专业行业群,加微信:13590381326,出示名片,仅限机器人及智能制造产业链相关企业。

*本文共约 5274 字,阅读完成需 9.5 分钟。


从2023年的AI大模型“元年”,到2024年的人形机器人“元年”、2025年的人形机器人“量产元年”,再到2026年的具身智能“应用元年”,这些年,具身智能产业正以远超人们想象的发展速度滚滚向前。

这些“元年”的背后,从国家政策到资本市场,从AI大模型到机器人本体,从实验室demo到场景的表达,我们可以看到,具身智能产业的各项技术远没有达到收敛的程度,与此同时,产业发展的背后有三股核心的力量在推动:

一是AI与大模型能力的快速发展。以VLA大模型π为例,模型每3到4个月即完成一次迭代,而且模型的能力呈指数级增长。

二是具身智能供应链的快速成熟。造人形机器人所需的核心部件,包括传感器、电机、减速机、计算单元等等,都能在市面上快速找到优秀的供应商。

三是场景的需求越来越明确。不管是智能制造行业,还是医疗健康、新零售等非工业场景,对于具身智能机器人的需求都更为确切且急迫。

三股力量之下,演进成具身智能产业的三大企业流派:


1、大模型公司专注于VLA、世界模型、Agent等概念,目的是打造通用人工智能,研究集中在“端到端”和认知智能等方向;


2、与形态强相关的企业主要追求硬件的极致性能与形态的极致仿生;


3场景驱动型企业更注重商业闭环和真实环境验证。


艾利特具身智能事业部负责人兼迈幸智能机器人CTO吴珉博士认为,不同路径的背后,本质是在回答同一个问题,具身智能究竟该如何真正落地?


艾利特对于这一问题的答案是,决定产业落地的核心是“模型、本体与场景的极致闭环”


吴珉进一步解释,如果只有模型,没有场景,特别是没有场景当中的高质量的数据,那么模型就没有办法持续进化;如果仅仅依靠数据,包括开源数据集的数据,训练出来的模型往往是一个通用,但是低能的模型,而真正的产业界客户需要的往往是一个专用且高能的模型;如果只有本体而没有场景,就会出现“拿着锤子找钉子”的窘境,机器人本体永远只能停留在实验室的demo阶段;如果只有场景而没有智能,最后的规模化复制就成了一纸空谈。


他认为,工业具身智能的商业化落地,本质上是一个自下而上、层层递进的金字塔式能力体系


塔基:工业场景沉淀——只有在真实的生产环境中积累了足够的工艺Know-how、工况数据与交付经验,后续的技术与产品才具备实际价值。


塔身:稳固的软硬件基座——包括通用的控制平台、运动控制算法、传感器集成与系统工程能力,为不同形态的产品提供统一的技术底座。


塔顶:多形态产品矩阵——覆盖不同场景、负载、形态的产品组合,实现规模化交付。


塔尖:AI大模型“智能引擎”——为整个体系赋予了认知、决策与泛化能力,让机器人从执行固定指令的自动化设备,进化为能够自主理解任务、适应变化工况的具身智能体。


因而,在艾利特的技术路线中,并不追求单一能力的极致,而是坚持从场景出发,再回到场景中去。通过场景需求和数据去训练针对场景的垂类模型;再针对这些场景,开发出特殊形态的本体,以服务这些场景;这个过程中产生的新数据又会用于迭代模型和本体,从而形成闭环,不断提高产品和模型的性能。


基于这些判断,艾利特自2016年成立起,就确立了“一脑多形”的技术路线,并在随后的10年间,一步一个脚印,持续探索、积累、迭代。



图片

从“智能工人”梦想到“一脑多形”实践



时间轴拉回到十年前,彼时和智能相关的概念,不要说大模型了,连“深度学习”这一概念也是刚刚兴起。


这一年,艾利特的创始团队绘制了一张技术路线图。这张图梳理了艾利特在智能方面的前期布局,包括智能CAM、机器视觉、语音识别、大数据、云计算、知识共享等。


针对不同的场景需求,艾利特规划了不同的机器人形态,包括单臂、双臂机器人,协作机器人、工业机器人、AGV等。


艾利特机器人董事长兼CEO曹宇男博士2018年接受高工机器人调研时即提出,未来的机器人都将成为“智能工人”,这是一个能够进行手脑配合,既有执行能力,又具备思考学习能力的智能体。机械、结构以及传统的运动控制技术是智能工人的基础支撑,视觉、AI等功能则是让智能工人真正实用化的内核与灵魂。


这十年间,艾利特在此技术路线的指引下,以协作机器人为第一种形态入局,快速抢占市场,同时服务于各个行业不同的场景,截至目前服务了全行业超过300个场景,其协作机器人与复合机器人已在AI基础设施(光模块、服务器)核心产线实现规模化部署,为多个AI产业链头部客户持续交付。在服务各个场景的过程当中,艾利特积累了海量的数据和场景的know-how,基于此不断打磨、迭代其软硬件核心基座技术。在这个基础上,艾利特拓展了移动复合机器人,以及基于各个垂类场景的新形态的机器人。


AI大模型的突破,让艾利特看到了以同一套具身智能中枢,驱动不同物理形态的机器人的技术实现的新希望,一脑多形”正是源自“智能工人”升级而来,一以贯之的战略方向



一脑多形的核心就是“大脑”。521,艾利特推出全自研工业级具身大模型平台的版本升级——元启 Primo



吴珉介绍,艾利特在开发“元启 Primo”具身智能大模型时,采用了一套面向机器人任务执行的分层式智能架构


整个系统并不是依赖单一的大模型完成所有任务,而是通过“任务调度—专项能力—融合决策—运动执行”的方式,实现复杂任务的协同处理。


第一层是任务调度系统这一层负责理解任务目标,并结合外部传感器信息、环境状态以及机器人自身状态,对任务进行拆解与编排。


例如,当机器人接收到“组装某个零件”的任务后,系统首先需要判断:当前需要完成什么目标;涉及哪些零部件与工具;操作流程如何组织;当前环境是否满足执行条件。同时,任务调度系统还会根据任务内容,动态激活后续所需的专项能力模块。


第二层是面向不同场景与技能构建的专项能力模块艾利特并没有采用“一个超大模型处理所有问题”的方式,而是针对空间感知、工具识别、工艺推理、力控操作等不同能力方向,构建了多个轻量化垂直模型


这些模型会根据任务需要被动态调用。例如,在零件组装过程中:空间感知模块负责定位与路径规划;工具识别模块负责识别工具状态;工艺推理模块负责判断装配逻辑;力控模块负责接触与插接过程中的实时反馈。由于系统只激活与当前任务相关的能力模块,因此整体参数规模与计算负载远低于传统通用大模型,更适合机器人实时运行与边缘部署。



再下一层是融合决策系统这一层会对各专项能力模块输出的信息进行统一协调与融合,形成局部“感知—决策—执行”闭环。


系统会持续结合视觉、空间、力觉以及任务状态,对动作过程中的误差进行动态修正,避免单一模块累积误差对任务造成影响。最终,融合决策系统会生成完整的动作序列,并传递给运动控制系统,实现机器人精细化操作。


吴珉表示,艾利特希望通过这种分层协同架构,让机器人系统既具备复杂任务理解能力,又能够满足工业场景对于实时性、稳定性与工程化部署的要求。



具身智能时代“半人马”



“脑”具备跨形态复用能力,而“身体”也完成长期工程化积累,新的机器人形态便会自然出现。轮式人形机器人Centaur-G1多形版图中最新的战略支点


Centaur-G1一词源自古希腊神话中的“半人马”——既期望它拥有马的移动与运载能力,也具备人的精细操作能力。其智能核心源自“元启Primo”大模型,从三个维度重构机器人的智能边界:



1多模态全域智能感知

元启Primo融合激光雷达、RGB-D相机、微距相机与六维力传感器,构建多源异构感知体系。面对反光零件、动态光照或密集堆叠场景,系统实时融合视觉、深度与力觉信息,生成稳定可操作的场景表征。



2具身智能操作大模型

元启Primo将高精度力控融入VLA架构,实现--协同,使机器人具备常识推理与多任务泛化端到端执行少样本适配三大能力。



3具身空间智能大模型

依托空间语义理解能力,元启Primo赋予机器人自主探索与语义建图自然语言指令理解长程任务逻辑拆解空间智能”。


在硬件构型上,Centaur-G1采用轮式底盘+人形上半身高精度双臂的构型设计。吴珉认为,轮式底盘更适合工业环境应用,因其更稳定、负载更强,企业可以把算力和精力集中在上半身操作的开发上。


该机器人支持精细化建图与自定义编辑,高节拍站点导航精度达±0.01m,支持全向移动,可在动态环境中实现自适应路径规划。


它配备7自由度冗余机械臂,单臂负载5公斤,双臂协同负载10公斤,重复定位精度±0.1mm。自研双臂协同规划算法可实现微力感知与柔顺装配,有效避免精密器件损伤。同时,可高效完成物料搬运、双手协作装配、精密插接等复杂工业任务。



Centaur-G1融合头部RGB-D相机、腕部双目微距相机及末端六维力传感器,结合激光雷达定位导航,构建视觉-深度-力觉一体化感知闭环。配合自研2.5D视觉泛化算法,系统对已知物体0.3秒内、未知物体1秒内即可完成识别与定位。


轮式人形机器人的自研策略上,除减速机外艾利特全部自研。这既是为了不被上游供应链锁住技术边界、制约高级能力的实现,也出于成本考量——轮式人形机器人的关节模组、SLAM算法、一体化控制器大量继承了协作机器人和复合机器人的成熟技术,核心零部件供应链共享,有效降低了成本。因此,对于艾利特机器人而言,人形机器人的研发成本与周期,因已有技术复用而显著压缩



现阶段,艾利特认为复合机器人与轮式人形机器人处于互补共存的状态:复合机器人适合重载搬运和高节拍任务,轮式人形机器人更适合需要双臂协同的复杂操作,且更便于人类操作技能的迁移。Centaur-G1目前处于与客户共同验证的阶段,计划先在示范场景中跑通,再下沉到真实产线。目前,艾利特机器人已成为行业内极少数同时具备“规模化交付经验”与“新形态快速复制能力”的企业。



From AI, For AI



凭借协作机器人与复合机器人在AI产业链(光模块、服务器产线等)规模化落地所积累的海量真实场景数据及头部客户交付经验,艾利特将轮式人形机器人Centaur-G1的率先落地场景锁定在AI产业链的三个核心环节


第一,AI Terminal(人工智能终端)涵盖智能手机、智能穿戴设备、智能载具的生产环节,核心场景包括果产线组装检测、充电/新能源充电检测、3C制造与组装,代表客户有立讯精密、理想汽车



第二,AI for Science(人工智能赋能科学)聚焦科研与生物制药领域的实验室自动化,包括自动化流程、样品高通量处理、数据优化与分析,代表客户为晶泰科技


第三,AI Infra(人工智能基础设施)这是艾利特当前发力的重中之重。核心场景覆盖光模块制造与组装检测、AI算力相关的核心零部件(光模块、光通信器件)生产,以及大型服务器机房的制造与维护代表客户旭创、达链等



围绕这三个方向,艾利特提出了四大落地价值:高精度(稳定可靠)、高节拍(提升效率)、可复制交付(快速部署)、多场景延展(持续创造价值)


AI Infra场景中,艾利特提出了一个极具战略深度的口号:From AI, For AI


过去几年,AI模型的飞速发展带来了对算力的爆发式增长需求,而支撑算力的正是光模块、光通信器件等核心硬件。艾利特的逻辑是:利用AI大模型为不同形态的机器人赋能,让它们变得更聪明,更好地服务于高端制造产线;这些产线生产出的光模块、光通信器件,又进一步促进AI基础设施的建设;而AI基础设施的扩容,反过来产生更多算力,用于模型的迭代进化——一套完整的闭环系统由此形成


这一AI驱动机器人机器人赋能AI基础设施基础设施反哺AI发展的循环,让具身智能不再仅仅是AI物理载体,更成为AI产业底层基建的关键参与者这不仅为艾利特打开了高天花板的市场空间,更让机器人技术的迭代与AI算力的扩张形成共振,构建起难以复制的产业壁垒。


目前,AI Infra场景已成为Centaur-G1打造产业标杆的核心阵地,其中包括


精密装配:通过双臂协同与微力感知,完成光器件耦合、光纤插拔、适配器锁紧等亚毫米级操作。


动态检测:利用腕部双目微距相机与六维力传感器,检测光模块外壳划痕、端口异物、适配器对中度等微米级缺陷。


智慧巡检:替代人工完成高频次、标准化的机房设备状态监测,实现从产线到机房的全链路自动化运维。



智能制造医疗康养科研实验室无人商超家庭服务更广泛的场景中,Centaur-G1同样展现出跨行业适配能力

根据吴珉透露,现阶段艾利特不盲目追求运动性能和传感性能的极致,旨在优先打磨标杆案例,为规模化复制奠定基础其核心目标是,借用这一形态打通AI到整体场景的闭环,真正跑通一个让客户认可的真实落地案例 



具身智能呼唤长期务实主义者



在具身智能这场热潮中,我们见过太多炫目的demo与宏大的叙事。人形机器人的“半年攒出1台”成为行业谈资,通用大模型被寄予一键解决所有问题的厚望。


然而,当喧嚣褪去,产业终将回到一个朴素的问题:这台机器人在真实的产线里,究竟能不能干活?


艾利特给出的答案也许并不性感,却格外务实——不追求单一形态的极致仿人,不迷信通用大模型的万能解法,而是用十年时间,试图走通从场景中来,到场景中去的闭环之路。在高工机器人看来,艾利特真正的价值不仅仅在于它发布了一款新的机器人形态,而在于它“一脑多形”去验证一条可复制的具身智能产业化路径。


具身智能的终局尚远,L3级别的多场景融合也许需要十年,L5级别的通用智能也许会在二十年之后在这个过程中,能够活下来并持续创造价值的企业,未必是那些demo最炫酷的,而大概率是那些在真实场景耐得住寂寞、攒得下数据、交付得了价值的长期主义者。


END— 


图片
活动广告
图片
以上为广告
往期推荐:





天机智能完成10亿元融资,高瓴、美团联合领投,加速打造全球领先的具身智能基础设施平台


鑫精诚Q1在机器人领域出货量突破10万只;天机Q1力控人形臂订单量超万台;步科Q1无框力矩电机销量约3.5万台 | 市场观察


再获上汽、中芯等“押注”数亿元,机器人六维力传感器龙头半年完成三轮融资

翼菲科技等3家企业港股挂牌上市;云深处、乐聚智能等3家企业A股IPO获受理;仙工智能完成港股上市备案 | 一周资本大事件
图片
了解具体商务合作详情