具身智能落地，感知能力迎来关键突破

html

具身智能落地，感知能力迎来关键突破

作者｜向欣

当前，具身智能领域普遍认为，2024年将成为人形机器人实现批量制造和商业落地的关键年。

随着部署规模的扩大，机器人的使用环境也日益复杂，从最初封闭的实验室拓展至充满不确定性的真实世界。

在开放环境中，机器人所依赖的感知能力变得尤为重要，而这一核心环节过去长期未受到应有重视。

机器人执行任务的过程本质上是“感知—决策—动作”的闭环。一旦感知出现偏差，后续操作与判断将难以准确执行。

以近期举办的人形机器人马拉松为例，这是一次持续性强、场景开放的挑战。机器人们面对不断变化的光照、多样的路面状况和长时间的户外运行，暴露出感知系统稳定性不足的问题。

画面中可以看到，部分机器人在接近终点时误入人群，显示出环境识别与路径判断的不稳定性。

一套稳定且高精度的感知系统，是机器人在开放世界中可靠运行的基础。

因此，原本低调的感知层关键元件，正逐渐成为行业关注的焦点，也成为机器人落地过程中的核心瓶颈之一。

沿着这一逻辑深入分析，机器人感知能力通常可划分为三个主要层次：环境感知、本体状态感知以及交互与操作感知。

环境感知：机器人认知世界的第一步

环境感知是机器人实现真实场景任务的基础环节，决定了其能否准确识别物体、判断空间距离，并完成导航、避障与定位。

在这一层级，核心硬件主要包括两种：

视觉传感器：包括RGB相机、双目相机、深度相机和鱼眼相机，主要用于图像采集、纹理分析和部分深度测量。
空间感知传感器：以激光雷达为代表，提供稳定的空间结构与距离信息。

奥比中光Gemini 330系列双目3D相机即为典型代表。

然而，即便能够采集图像数据，机器人也未必能“看懂”环境。

例如，当面对复杂光照、动态人流和室内外切换场景时，RGB相机易出现图像失真，逆光下目标区域变暗，强反光削弱边缘信息，夜间图像质量显著下降。

动态环境中的移动物体也增加了识别与定位的难度，可能导致目标丢失或距离判断失误。

除了光照与动态识别的挑战，环境感知还面临两个主要难题：

手眼协同要求高：视觉与激光雷达因肢体运动易产生动态畸变、视角跳变和运动模糊，影响目标定位。
算力与延迟压力大：多个传感器同时工作带来大量数据流，处理延迟可能导致路径判断偏差和抓取不精准。

实现手、眼、物体间的亚厘米级实时匹配至关重要，任何偏差都将影响抓取精度或引发碰撞。

为应对这些问题，行业正重点推进深度感知与空间理解能力。

深度感知使机器人能够获取目标的距离、轮廓和空间结构信息；空间理解则进一步帮助其识别障碍物、判断物体与环境的关系。

围绕这两方面，行业主要采取两种解决方案：

从二维图像识别转向三维空间理解。
从单一视觉感知向多传感器融合演进，如视觉+激光雷达。

多家企业已在不同方向展开布局。

奥比中光聚焦于3D视觉，其Gemini 330系列搭载自研MX6800深度引擎芯片，具备高稳定性的三维数据输出能力。

禾赛科技则通过Kosmo产品，融合定制激光雷达、多摄像头及AIGC技术，实现空间场景的数字化还原。

速腾聚创则开发出Active Camera，将深度、色彩和姿态信息在芯片层面集成，实现毫秒级时空同步。

相比传统多传感器叠加方案，这种方式显著提升了系统一致性与响应效率。

尽管各家路径不同，目标却高度一致：使机器人具备在复杂环境中的稳定空间认知能力。

本体状态感知：支撑机器人动态控制的“体内感官”

除了感知环境，机器人在动态运动中还需了解自身状态，以维持平衡、控制力量，并完成稳定执行。

支撑本体感知的核心器件包括：

惯性传感器（IMU）：用于测量角速度与加速度，支撑姿态估计与动态平衡。
力矩与力传感器：如关节扭矩传感器、六维力传感器和足底力传感器，用于监测受力变化。

本体状态感知的难点主要体现在以下几个方面：

对响应速度与稳定性要求极高，延迟可能引发动作节奏混乱。
量产过程中对传感器一致性和可靠性提出更高要求。
在空间受限的环境中，需兼顾小型化、高精度与低成本。

以特斯拉机器人为例，其双脚使用的两个六维力传感器成本就高达6700美元。

因此，传感器的小型化、高动态适应性与量产一致性成为当前行业攻坚重点。

在这一领域，两类企业表现突出：

来自智能驾驶领域、在汽车体系中积累深厚的企业，如导远科技。
专注于力传感器的专业厂商，如坤维科技和鑫精诚。

导远科技的IMU5146模组已应用于银河通用的人形机器人，输出频率高达1000Hz，延迟极低，能在跳跃、翻滚等高强度动态中稳定工作。

其产品支持-40℃至105℃宽温运行，具备高可靠性与量产能力。

坤维科技则推出HRS人形系列六维力传感器，重复精度优于0.1%，并已批量供货优必选和银河通用。

鑫精诚则在MEMS六维力传感器上取得突破，正布局自动化产线，提升供给能力。

交互与操作感知：迈向精细操作的关键能力

尽管机器人已具备导航、避障等能力，但要实现插拔接口、捏鸡蛋等精细操作任务，还缺少一层感知能力：触觉。

许多高价值任务如装配、抓取柔性物体等，都需要细腻的触觉反馈。

尽管触觉感知目前尚未成熟，但其有望成为下一阶段灵巧操作的分水岭。

现有触觉传感器主要包括电子皮肤、指尖触觉、阵列式压力传感器及视触觉传感器等。

它们多部署于手部、夹爪和末端执行器，承担接触检测、压力感知、材质识别和形变判断等任务。

触觉感知面临的主要挑战包括：

产品与标准体系尚未成熟，数据复用困难。
传感器长期处于接触、摩擦状态，对寿命和稳定性要求高。
集成难度大，需兼顾灵敏度与小型化。
算法融合复杂，触觉信号与视觉、动作控制的协同仍处于探索阶段。
成本较高，尚未实现大规模低成本普及。

帕西尼感知在产品与数据两方面同步推进，其PX-6AX-GEN3多维触觉传感器可输出六维力、材质、温度、回弹等信息，并具备工业级使用寿命。

他山科技则专注于底层芯片研发，推出支持三维力感知与材质识别的AI触感芯片。

戴盟机器人联合多机构发布全球最大规模的含触觉全模态数据集Daimon-Infinity，为触觉数据标准化与算法训练奠定基础。

综合来看，机器人感知能力的演进路径对应着三个竞争焦点：

以视觉为主的环境感知传感器是机器人认知世界的入口。
以力觉为主的本体感知传感器是当下的技术瓶颈，决定了机器人能否稳定执行任务。
触觉感知则是未来灵巧操作的突破口，将决定机器人能否真正“干活”。

无论是在马拉松赛场、工厂产线，还是在仓储分拣与家庭服务中，人形机器人的规模化落地都依赖于感知系统的完善。

感知链路的质量将直接影响决策与执行效率。

随着应用场景从实验室样机验证走向真实复杂环境，对感知系统的稳定性、可复制性与量产能力提出了更高要求。

这一层级的能力突破，或将成为机器人产业落地进程中的关键拐点。

原文标题：具身智能落地，开始补“感知”这一课

菜单

分享

具身智能落地，感知能力迎来关键突破