具身智能落地,感知能力迎来关键突破
作者|向欣
当前,具身智能领域普遍认为,2024年将成为人形机器人实现批量制造和商业落地的关键年。
随着部署规模的扩大,机器人的使用环境也日益复杂,从最初封闭的实验室拓展至充满不确定性的真实世界。
在开放环境中,机器人所依赖的感知能力变得尤为重要,而这一核心环节过去长期未受到应有重视。
机器人执行任务的过程本质上是“感知—决策—动作”的闭环。一旦感知出现偏差,后续操作与判断将难以准确执行。
以近期举办的人形机器人马拉松为例,这是一次持续性强、场景开放的挑战。机器人们面对不断变化的光照、多样的路面状况和长时间的户外运行,暴露出感知系统稳定性不足的问题。
画面中可以看到,部分机器人在接近终点时误入人群,显示出环境识别与路径判断的不稳定性。
一套稳定且高精度的感知系统,是机器人在开放世界中可靠运行的基础。
因此,原本低调的感知层关键元件,正逐渐成为行业关注的焦点,也成为机器人落地过程中的核心瓶颈之一。
沿着这一逻辑深入分析,机器人感知能力通常可划分为三个主要层次:环境感知、本体状态感知以及交互与操作感知。
环境感知:机器人认知世界的第一步
环境感知是机器人实现真实场景任务的基础环节,决定了其能否准确识别物体、判断空间距离,并完成导航、避障与定位。
在这一层级,核心硬件主要包括两种:
- 视觉传感器:包括RGB相机、双目相机、深度相机和鱼眼相机,主要用于图像采集、纹理分析和部分深度测量。
- 空间感知传感器:以激光雷达为代表,提供稳定的空间结构与距离信息。
奥比中光Gemini 330系列双目3D相机即为典型代表。
然而,即便能够采集图像数据,机器人也未必能“看懂”环境。
例如,当面对复杂光照、动态人流和室内外切换场景时,RGB相机易出现图像失真,逆光下目标区域变暗,强反光削弱边缘信息,夜间图像质量显著下降。
动态环境中的移动物体也增加了识别与定位的难度,可能导致目标丢失或距离判断失误。
除了光照与动态识别的挑战,环境感知还面临两个主要难题:
- 手眼协同要求高:视觉与激光雷达因肢体运动易产生动态畸变、视角跳变和运动模糊,影响目标定位。
- 算力与延迟压力大:多个传感器同时工作带来大量数据流,处理延迟可能导致路径判断偏差和抓取不精准。
实现手、眼、物体间的亚厘米级实时匹配至关重要,任何偏差都将影响抓取精度或引发碰撞。
为应对这些问题,行业正重点推进深度感知与空间理解能力。
深度感知使机器人能够获取目标的距离、轮廓和空间结构信息;空间理解则进一步帮助其识别障碍物、判断物体与环境的关系。
围绕这两方面,行业主要采取两种解决方案:
- 从二维图像识别转向三维空间理解。
- 从单一视觉感知向多传感器融合演进,如视觉+激光雷达。
多家企业已在不同方向展开布局。
奥比中光聚焦于3D视觉,其Gemini 330系列搭载自研MX6800深度引擎芯片,具备高稳定性的三维数据输出能力。
禾赛科技则通过Kosmo产品,融合定制激光雷达、多摄像头及AIGC技术,实现空间场景的数字化还原。
速腾聚创则开发出Active Camera,将深度、色彩和姿态信息在芯片层面集成,实现毫秒级时空同步。
相比传统多传感器叠加方案,这种方式显著提升了系统一致性与响应效率。
尽管各家路径不同,目标却高度一致:使机器人具备在复杂环境中的稳定空间认知能力。
本体状态感知:支撑机器人动态控制的“体内感官”
除了感知环境,机器人在动态运动中还需了解自身状态,以维持平衡、控制力量,并完成稳定执行。
支撑本体感知的核心器件包括:
- 惯性传感器(IMU):用于测量角速度与加速度,支撑姿态估计与动态平衡。
- 力矩与力传感器:如关节扭矩传感器、六维力传感器和足底力传感器,用于监测受力变化。
本体状态感知的难点主要体现在以下几个方面:
- 对响应速度与稳定性要求极高,延迟可能引发动作节奏混乱。
- 量产过程中对传感器一致性和可靠性提出更高要求。
- 在空间受限的环境中,需兼顾小型化、高精度与低成本。
以特斯拉机器人为例,其双脚使用的两个六维力传感器成本就高达6700美元。
因此,传感器的小型化、高动态适应性与量产一致性成为当前行业攻坚重点。
在这一领域,两类企业表现突出:
- 来自智能驾驶领域、在汽车体系中积累深厚的企业,如导远科技。
- 专注于力传感器的专业厂商,如坤维科技和鑫精诚。
导远科技的IMU5146模组已应用于银河通用的人形机器人,输出频率高达1000Hz,延迟极低,能在跳跃、翻滚等高强度动态中稳定工作。
其产品支持-40℃至105℃宽温运行,具备高可靠性与量产能力。
坤维科技则推出HRS人形系列六维力传感器,重复精度优于0.1%,并已批量供货优必选和银河通用。
鑫精诚则在MEMS六维力传感器上取得突破,正布局自动化产线,提升供给能力。
交互与操作感知:迈向精细操作的关键能力
尽管机器人已具备导航、避障等能力,但要实现插拔接口、捏鸡蛋等精细操作任务,还缺少一层感知能力:触觉。
许多高价值任务如装配、抓取柔性物体等,都需要细腻的触觉反馈。
尽管触觉感知目前尚未成熟,但其有望成为下一阶段灵巧操作的分水岭。
现有触觉传感器主要包括电子皮肤、指尖触觉、阵列式压力传感器及视触觉传感器等。
它们多部署于手部、夹爪和末端执行器,承担接触检测、压力感知、材质识别和形变判断等任务。
触觉感知面临的主要挑战包括:
- 产品与标准体系尚未成熟,数据复用困难。
- 传感器长期处于接触、摩擦状态,对寿命和稳定性要求高。
- 集成难度大,需兼顾灵敏度与小型化。
- 算法融合复杂,触觉信号与视觉、动作控制的协同仍处于探索阶段。
- 成本较高,尚未实现大规模低成本普及。
帕西尼感知在产品与数据两方面同步推进,其PX-6AX-GEN3多维触觉传感器可输出六维力、材质、温度、回弹等信息,并具备工业级使用寿命。
他山科技则专注于底层芯片研发,推出支持三维力感知与材质识别的AI触感芯片。
戴盟机器人联合多机构发布全球最大规模的含触觉全模态数据集Daimon-Infinity,为触觉数据标准化与算法训练奠定基础。
综合来看,机器人感知能力的演进路径对应着三个竞争焦点:
- 以视觉为主的环境感知传感器是机器人认知世界的入口。
- 以力觉为主的本体感知传感器是当下的技术瓶颈,决定了机器人能否稳定执行任务。
- 触觉感知则是未来灵巧操作的突破口,将决定机器人能否真正“干活”。
无论是在马拉松赛场、工厂产线,还是在仓储分拣与家庭服务中,人形机器人的规模化落地都依赖于感知系统的完善。
感知链路的质量将直接影响决策与执行效率。
随着应用场景从实验室样机验证走向真实复杂环境,对感知系统的稳定性、可复制性与量产能力提出了更高要求。
这一层级的能力突破,或将成为机器人产业落地进程中的关键拐点。
原文标题:具身智能落地,开始补“感知”这一课