1台轮式人形机器人，1家企业的10年战略定力

加入高工机器人专业行业群，加微信：13590381326，出示名片，仅限机器人及智能制造产业链相关企业。

*本文共约 5274 字，阅读完成需 9.5 分钟。

从2023年的AI大模型“元年”，到2024年的人形机器人“元年”、2025年的人形机器人“量产元年”，再到2026年的具身智能“应用元年”，这些年，具身智能产业正以远超人们想象的发展速度滚滚向前。

这些“元年”的背后，从国家政策到资本市场，从AI大模型到机器人本体，从实验室demo到场景的表达，我们可以看到，具身智能产业的各项技术远没有达到收敛的程度，与此同时，产业发展的背后有三股核心的力量在推动：

一是AI与大模型能力的快速发展。以VLA大模型π为例，模型每3到4个月即完成一次迭代，而且模型的能力呈指数级增长。

二是具身智能供应链的快速成熟。造人形机器人所需的核心部件，包括传感器、电机、减速机、计算单元等等，都能在市面上快速找到优秀的供应商。

三是场景的需求越来越明确。不管是智能制造行业，还是医疗健康、新零售等非工业场景，对于具身智能机器人的需求都更为确切且急迫。

三股力量之下，演进成具身智能产业的三大企业流派：

1、大模型公司，专注于VLA、世界模型、Agent等概念，目的是打造通用人工智能，研究集中在“端到端”和认知智能等方向；

2、与形态强相关的企业，主要追求硬件的极致性能与形态的极致仿生；

3、场景驱动型企业，更注重商业闭环和真实环境验证。

艾利特具身智能事业部负责人兼迈幸智能机器人CTO吴珉博士认为，不同路径的背后，本质是在回答同一个问题，具身智能究竟该如何真正落地？

艾利特对于这一问题的答案是，决定产业落地的核心是“模型、本体与场景的极致闭环”。

吴珉进一步解释，如果只有模型，没有场景，特别是没有场景当中的高质量的数据，那么模型就没有办法持续进化；如果仅仅依靠数据，包括开源数据集的数据，训练出来的模型往往是一个通用，但是低能的模型，而真正的产业界客户需要的往往是一个专用且高能的模型；如果只有本体而没有场景，就会出现“拿着锤子找钉子”的窘境，机器人本体永远只能停留在实验室的demo阶段；如果只有场景而没有智能，最后的规模化复制就成了一纸空谈。

他认为，工业具身智能的商业化落地，本质上是一个自下而上、层层递进的金字塔式能力体系。

塔基：工业场景沉淀——只有在真实的生产环境中积累了足够的工艺Know-how、工况数据与交付经验，后续的技术与产品才具备实际价值。

塔身：稳固的软硬件基座——包括通用的控制平台、运动控制算法、传感器集成与系统工程能力，为不同形态的产品提供统一的技术底座。

塔顶：多形态产品矩阵——覆盖不同场景、负载、形态的产品组合，实现规模化交付。

塔尖：AI大模型“智能引擎”——为整个体系赋予了认知、决策与泛化能力，让机器人从执行固定指令的自动化设备，进化为能够自主理解任务、适应变化工况的具身智能体。

因而，在艾利特的技术路线中，并不追求单一能力的极致，而是坚持从场景出发，再回到场景中去。通过场景需求和数据去训练针对场景的垂类模型；再针对这些场景，开发出特殊形态的本体，以服务这些场景；这个过程中产生的新数据又会用于迭代模型和本体，从而形成闭环，不断提高产品和模型的性能。

基于这些判断，艾利特自2016年成立起，就确立了“一脑多形”的技术路线，并在随后的10年间，一步一个脚印，持续探索、积累、迭代。

从“智能工人”梦想到“一脑多形”实践

时间轴拉回到十年前，彼时和智能相关的概念，不要说大模型了，连“深度学习”这一概念也是刚刚兴起。

这一年，艾利特的创始团队绘制了一张技术路线图。这张图梳理了艾利特在智能方面的前期布局，包括智能CAM、机器视觉、语音识别、大数据、云计算、知识共享等。

针对不同的场景需求，艾利特规划了不同的机器人形态，包括单臂、双臂机器人，协作机器人、工业机器人、AGV等。

艾利特机器人董事长兼CEO曹宇男博士在2018年接受高工机器人调研时即提出，未来的机器人都将成为“智能工人”，这是一个能够进行手脑配合，既有执行能力，又具备思考学习能力的智能体。机械、结构以及传统的运动控制技术是智能工人的基础支撑，视觉、AI等功能则是让智能工人真正实用化的内核与灵魂。

这十年间，艾利特在此技术路线的指引下，以协作机器人为第一种形态入局，快速抢占市场，同时服务于各个行业不同的场景，截至目前服务了全行业超过300个场景，其协作机器人与复合机器人已在AI基础设施（光模块、服务器）核心产线实现规模化部署，为多个AI产业链头部客户持续交付。在服务各个场景的过程当中，艾利特积累了海量的数据和场景的know-how，基于此不断打磨、迭代其软硬件核心基座技术。在这个基础上，艾利特拓展了移动复合机器人，以及基于各个垂类场景的新形态的机器人。

AI大模型的突破，让艾利特看到了“以同一套具身智能中枢，驱动不同物理形态的机器人”的技术实现的新希望，“一脑多形”正是源自“智能工人”升级而来，一以贯之的战略方向。

一脑多形的核心就是“大脑”。5月21日，艾利特推出全自研工业级具身大模型平台的版本升级——“元启 Primo”。

吴珉介绍，艾利特在开发“元启 Primo”具身智能大模型时，采用了一套面向机器人任务执行的分层式智能架构。

整个系统并不是依赖单一的大模型完成所有任务，而是通过“任务调度—专项能力—融合决策—运动执行”的方式，实现复杂任务的协同处理。

第一层是任务调度系统。这一层负责理解任务目标，并结合外部传感器信息、环境状态以及机器人自身状态，对任务进行拆解与编排。

例如，当机器人接收到“组装某个零件”的任务后，系统首先需要判断：当前需要完成什么目标；涉及哪些零部件与工具；操作流程如何组织；当前环境是否满足执行条件。同时，任务调度系统还会根据任务内容，动态激活后续所需的专项能力模块。

第二层是面向不同场景与技能构建的专项能力模块。艾利特并没有采用“一个超大模型处理所有问题”的方式，而是针对空间感知、工具识别、工艺推理、力控操作等不同能力方向，构建了多个轻量化垂直模型。

这些模型会根据任务需要被动态调用。例如，在零件组装过程中：空间感知模块负责定位与路径规划；工具识别模块负责识别工具状态；工艺推理模块负责判断装配逻辑；力控模块负责接触与插接过程中的实时反馈。由于系统只激活与当前任务相关的能力模块，因此整体参数规模与计算负载远低于传统通用大模型，更适合机器人实时运行与边缘部署。

再下一层是融合决策系统。这一层会对各专项能力模块输出的信息进行统一协调与融合，形成局部“感知—决策—执行”闭环。

系统会持续结合视觉、空间、力觉以及任务状态，对动作过程中的误差进行动态修正，避免单一模块累积误差对任务造成影响。最终，融合决策系统会生成完整的动作序列，并传递给运动控制系统，实现机器人精细化操作。

吴珉表示，艾利特希望通过这种分层协同架构，让机器人系统既具备复杂任务理解能力，又能够满足工业场景对于实时性、稳定性与工程化部署的要求。

具身智能时代的“半人马”

当“脑”具备跨形态复用能力，而“身体”也完成长期工程化积累，新的机器人形态便会自然出现。轮式人形机器人Centaur-G1，正是“多形”版图中最新的战略支点。

Centaur-G1一词源自古希腊神话中的“半人马”——既期望它拥有马的移动与运载能力，也具备人的精细操作能力。其智能核心源自“元启Primo”大模型，从三个维度重构机器人的智能边界：

1、多模态全域智能感知

元启Primo融合激光雷达、RGB-D相机、微距相机与六维力传感器，构建多源异构感知体系。面对反光零件、动态光照或密集堆叠场景，系统实时融合视觉、深度与力觉信息，生成稳定可操作的场景表征。

2、具身智能操作大模型

元启Primo将高精度力控融入VLA架构，实现“手-眼-力”协同，使机器人具备常识推理与多任务泛化、端到端执行、少样本适配三大能力。

3、具身空间智能大模型

依托空间语义理解能力，元启Primo赋予机器人自主探索与语义建图、自然语言指令理解、长程任务逻辑拆解的“空间智能”。

在硬件构型上，Centaur-G1采用“轮式底盘+人形上半身高精度双臂”的构型设计。吴珉认为，轮式底盘更适合工业环境应用，因其更稳定、负载更强，企业可以把算力和精力集中在上半身操作的开发上。

该机器人支持精细化建图与自定义编辑，高节拍站点导航精度达±0.01m，支持全向移动，可在动态环境中实现自适应路径规划。

它配备了7自由度冗余机械臂，单臂负载5公斤，双臂协同负载10公斤，重复定位精度±0.1mm。自研双臂协同规划算法可实现微力感知与柔顺装配，有效避免精密器件损伤。同时，可高效完成物料搬运、双手协作装配、精密插接等复杂工业任务。

Centaur-G1融合头部RGB-D相机、腕部双目微距相机及末端六维力传感器，结合激光雷达定位导航，构建“视觉-深度-力觉”一体化感知闭环。配合自研2.5D视觉泛化算法，系统对已知物体0.3秒内、未知物体1秒内即可完成识别与定位。

在轮式人形机器人的自研策略上，除减速机外艾利特全部自研。这既是为了不被上游供应链锁住技术边界、制约高级能力的实现，也出于成本考量——轮式人形机器人的关节模组、SLAM算法、一体化控制器等大量继承了协作机器人和复合机器人的成熟技术，核心零部件供应链共享，有效降低了成本。因此，对于艾利特机器人而言，人形机器人的研发成本与周期，因已有技术复用而显著压缩。

现阶段，艾利特认为复合机器人与轮式人形机器人处于互补共存的状态：复合机器人适合重载搬运和高节拍任务，轮式人形机器人更适合需要双臂协同的复杂操作，且更便于人类操作技能的迁移。Centaur-G1目前处于与客户共同验证的阶段，计划先在示范场景中跑通，再下沉到真实产线。目前，艾利特机器人已成为行业内极少数同时具备“规模化交付经验”与“新形态快速复制能力”的企业。

From AI, For AI

凭借协作机器人与复合机器人在AI产业链（光模块、服务器产线等）规模化落地所积累的海量真实场景数据及头部客户交付经验，艾利特将轮式人形机器人Centaur-G1的率先落地场景锁定在AI产业链的三个核心环节：

第一，AI Terminal（人工智能终端）。涵盖智能手机、智能穿戴设备、智能载具的生产环节，核心场景包括果链产线组装检测、充电/新能源充电检测、3C制造与组装，代表客户有立讯精密、理想汽车等。

第二，AI for Science（人工智能赋能科学）。聚焦科研与生物制药领域的实验室自动化，包括自动化流程、样品高通量处理、数据优化与分析，代表客户为晶泰科技等。

第三，AI Infra（人工智能基础设施）。这是艾利特当前发力的重中之重。核心场景覆盖光模块制造与组装检测、AI算力相关的核心零部件（光模块、光通信器件）生产，以及大型服务器机房的制造与维护，代表客户有中际旭创、达链等。

围绕这三个方向，艾利特提出了四大落地价值：高精度（稳定可靠）、高节拍（提升效率）、可复制交付（快速部署）、多场景延展（持续创造价值）。

在AI Infra场景中，艾利特提出了一个极具战略深度的口号：From AI, For AI。

过去几年，AI模型的飞速发展带来了对算力的爆发式增长需求，而支撑算力的正是光模块、光通信器件等核心硬件。艾利特的逻辑是：利用AI大模型为不同形态的机器人赋能，让它们变得更聪明，更好地服务于高端制造产线；这些产线生产出的光模块、光通信器件，又进一步促进AI基础设施的建设；而AI基础设施的扩容，反过来产生更多算力，用于模型的迭代进化——一套完整的闭环系统由此形成。