lch
发布于 2026-05-18 / 0 阅读
0

消费级具身智能跨越式新品:算力提升1000倍,对标英伟达Jetson Thor芯片,成本仅1/10!

机器之心发布

刚刚,蔚蓝科技发布了新款机器狗。


外表看起来像 "玩具",但性能堪比服务器。


它不翻跟头,不跑障碍,过去五年行业 "卷" 的炫技,它没跟。


但它可能是消费级具身智能第一次真正配得上 "能" 两个字的产品



早在 2023 年,这家公司就发布了全球首款家庭陪伴四足机器人 BabyAlpha,卖了 2.5 万多台。


有人觉得酷,有人觉得鸡肋。褒贬不一。


3 年后,他们把那些质疑都用技术砸了回去。


这代产品干了一件非常底层的事 —— 给机器狗装上一套超越人类的感知系统,外加一套能撑起端侧大模型的异构算力架构,相较上一代算力提升 1000 倍,对标英伟达 2,070 TFLOPS 算力的 Jetson AGX Thor T5000 芯片,但成本仅为英伟达的约 1/10



颠覆性创新之父 Clayton M. Christensen 曾说:"The next big thing will start out looking like a toy." (下一个颠覆时代的伟大事物,起初看上去都像一件玩具。)


今天,当我们谈论感知与思考的突破时,真正的指向并非一台更具噱头的机器狗,而是通用人工智能机器人的原点 —— 人造劳动力。


而这台万元级机器狗的背后,或许藏着 “人造劳动力” 从概念走向落地的关键一步。


国产算力方案如何撕开一道口子


先看行业现状。


四足机器人常用的几款芯片 ——RK3588、Orin NX、S100P—— 算力上限 6-128 TOPS(每秒万亿次操作)。


单芯片要同时跑视觉感知、3D 建图、运动控制、大模型交互、安全冗余,少说 5-6 个任务,根本分配不过来。


最直接的体现就是端侧大模型。


行业产品跑个 15 亿参数模型,TPS(每秒处理的 Token 数)最高也就 20 几;70 亿参数的,大多数直接跑不动。


参数稍微大一点就卡成 PPT,你跟它对话得等好几秒才有反应,还谈什么交互体验。可是参数要小的话,跑是跑得动了,但智能表现宛如 "智障"。

BabyAlpha A3 是怎么破这个局的?


它没有继续沿用行业通用的单芯片方案,而是搞了一套自己的具身智能边缘端混合异构计算集群



简单说,就是 6 颗芯片分布式协同:2 颗 5 纳米 + 2 颗 8 纳米 + 2 颗 3D 堆叠,一共 22 核 CPU。


核心逻辑:不同任务分配给最擅长的芯片 ——5 纳米跑大模型推理,8 纳米处理感知数据,3D 堆叠管运动控制。三者通过高速总线互联,任务切换延迟控制在毫秒级。


对比行业主流方案,不是同一个量级。


15 亿参数 TPS,从行业最高的 23 飙到 617,70 亿参数 TPS 能到 280,意味着端侧大模型在消费级产品上第一次真正可用


数据声明

1: 以上参数均为各型号消费级旗舰款规格参数。

2: 本表格数据来源于各品牌官方网站产品页及技术文档中心 (2026 年 5 月获取)、第三方公开评测报告。如有误差,请联系更正。

3: 各产品持续迭代,配置以最新官方信息为准


关键的是:这套方案完全采用国产芯片设计与制造工艺,突破了美国高端芯片、先进制程对国内企业的封锁。


对标英伟达 Jetson AGX Thor T5000(售价约 3000 美金),蔚蓝用国产方案实现更高算力,成本仅 300 余美金。


而这条路线一旦跑通,带来的不只是成本优势。


蔚蓝自研算法模型架构 + 蔚蓝自研算法模型架构 + 异构计算架构,实现了对传统 GPU 路线的效率代际领先:更高算力下成本仅为英伟达的约 1/10,同等成本下算力大幅领先。


这个技术路径的突破不止适用于机器人 —— 它具备通用性,可以拓展到数据中心级大规模算力场景。


按照行业 12-18 个月算力成本下降一半的节奏,近 10 倍的成本效率优势意味着:把行业 3-4 年后的算力能力,提前拉到今天。



感知指标超人类:比人更安全自主行动的前提


算力突破是脑子,但光有脑子不够。


机器人要在家庭场景里安全行动,感知能力必须超过人类


不是 "接近人类",是超过。


人靠常识兜底 —— 拖鞋是软的、线缆不能踩、玻璃门要绕开,看不清也猜得到。


机器没有常识,感知不够就真的看不见、听不明,行动如 “摸瞎”。


行业现在是什么水平?


视觉 100-300 万像素、HDR 不到 90db,逆光暗光就糊。空间靠 16 线激光雷达,3-8 万点 / 秒,相当于马赛克地图导航。听觉单麦或 4 麦,定位声源基本做不到。


感知天花板太低,"看清" 都做不到,更别说 "看懂"。


BabyAlpha A3 是如何打破这一瓶颈的呢?


他们拿出了一套非常硬核的硬件配置:


数据声明

1: 以上参数均为各型号消费级旗舰款规格参数。

2: 本表格数据来源于各品牌官方网站产品页及技术文档中心 (2026 年 5 月获取)、第三方公开评测报告。如有误差,请联系更正。

3: 各产品持续迭代,配置以最新官方信息为准。


视觉:6600 万像素、HDR 140dB、480fps,多维度超过人眼


8K+4K+4K 三组高清摄像头,360 度环视,总像素 6600 万 —— 像素水平飙到行业平均水准的 30 + 倍!


HDR 140dB,超过人眼 100-120dB 的动态范围,逆光窗边、阴影交错处单帧内同时捕捉高光和暗部细节。


帧率最高 480fps,远超人眼 60fps,这意味着 A3 能以极致慢镜视野,清晰捕捉每一瞬的动态细节。


人眼约 200 度视野,脑后和侧面都是盲区。A3 能实现 360 度全覆盖,不需要 "回头" 就能感知身后环境。



空间感知:360° 环视面阵,从马赛克地图到厘米级 3D 地图


5 组 3D TOF 和 3D 结构光构成 360° 环视面阵,点云密度 223.2 万点 / 秒 —— 行业主流 3-8 万,几十倍差距。


8 万点看到模糊轮廓,223.2 万点能看清地板上的充电线、扁平的拖鞋、玻璃门半开的那条缝。


点云密度够高,才能构建厘米级精度的 3D 环境地图 —— 这不是 "看到了",是 "看清了、测准了、能导航了"。


自动测距、实时标注,自主导航的物理基础全靠这个精度。



听觉:12 麦立体阵列 —— 仿生猫头鹰,360 度声源精确定位


行业方案惯用 1-4 颗麦克风,只能判断声源大概方向。A3 用了 12 颗。

12 颗麦克风按 3D Mesh 拓扑分布在头部,不是平面排列,而是立体覆盖 —— 类似猫头鹰双耳左右不对称的原理,通过空间 "错位" 产生时间差和音量差,同时解算声源的方位角、俯仰角和距离,3D 空间中精确定位


定位之后是聚焦。波束成形在目标方向形成极窄波束,只收目标声源,其他方向全部抑制 —— 电视声、空调声、旁边人的聊天声,不影响它听你的。4~8kHz 儿童高频段衰减更小,孩子的高音调呼唤也认得准。


配合超声波雷达环形阵列,全球首次消费级量产应用



总之,感知系统的 “革命性” 创新,不是炫技,而是安全底线


机器没有常识兜底,感知必须比人更强,才可能在家庭里真正安全地自主行动。


当机器人的运动终于摆脱遥控和指令


行业过去五年卷的是运动 —— 翻跟头、跑障碍、后空翻,这些确实做到了。


但问题从来不是 "跑不动",而是 "不知道往哪跑"。


算力不够,自主导航跑不了复杂算法;感知不够,看不清环境细节,遇到透明物体就懵、碰到细小障碍就绕不开。


结果就是:运动能力很强,但只能用在遥控和简单场景下。用户评价 ——"不是不能用,是还不太好用"。


而从 "能跑" 到 "能用",差的不是运动参数,是自主能力。


数据声明

1: 以上参数均为各型号消费级旗舰款规格参数。

2: 本表格数据来源于各品牌官方网站产品页及技术文档中心 (2026 年 5 月获取)、第三方公开评测报告。如有误差,请联系更正。

3: 各产品持续迭代,配置以最新官方信息为准。


A3 的运动能力 ——3.5 m/s 最高速度、45° 爬坡、28cm 越障,参数尚佳却不咋稀奇,行业已经卷了好几年。


真正与众不同的是:全天候全自主智能。


过去四足机器人的运动参数再漂亮,也得人操控。


A3 靠算力调度和感知精度,在家庭里自主判断怎么过楼梯、过门槛、上斜坡。



行业里大多还停留在 “伪自主” 阶段:


要么依赖 UWB 测距 + 用户佩戴定位标签,一旦摘下标签,机器人就无法定位你;


要么是 “发指令→执行” 的半自主模式,你不主动操控,它就原地不动,和遥控玩具没有本质区别。


而 BabyAlpha A3,彻底告别了这些限制:


它不需要任何外部标签或基站,通过 360° 环视面阵,搭配超声波近场避障,由端侧 Physical AI 算法独立完成建图、定位与路径规划 —— 真正实现 “自己看、自己认、自己走”,遇到障碍主动躲避绕行。


跟随体验也迎来了质的飞跃:它不再被动等待你的指令,而是主动适配你的节奏 —— 你加快脚步它就提速,你转弯它提前预判,始终跟在你身边,随需而动。


这种 “真自主” 的背后,是行业首次在消费级四足机器人上,打通感知、决策、运动三大子系统的全闭环。


安全不是加分项,是准入门槛


机器人进家庭,用户最关心的问题永远只有一个 —— 安全吗?


行业现有的安全思路,基本是做加法:加急停按钮、加物理围栏、加碰撞检测。


本质是能力不够,用冗余来补。机器人看不清、想不明白,只能靠事后补救。


A3 的逻辑不同 —— 安全不是外挂的防护层,而是算力、感知、架构一体化设计的自然结果。


不是一句 "我们承诺不泄露" 的空话,而是从架构上让你不需要信任任何人的承诺:


  • 物理安全 —— 形态上消除隐患。关节全隐藏,夹不到,撞不伤。独立安全制动系统,故障时毫秒级响应

  • 系统安 —— 端云双重守护。端侧 360 安全大脑拦住攻击,云端等保三级 + 阿里云 + Azure 护航

  • 数据和隐私安全 —— 算力在本地,数据不外传。每一步启动可验证,存着加密,传着加密



七年前,蔚蓝选择发力家庭机器人赛道 ——不是 Demo,不是展厅款,而是面向普通家庭真实使用场景 —— 有老人、小孩、宠物的那种。


七年七代产品,目前已有超 1 万活跃家庭使用产品,累计运行时长超 1500 万小时。


所有安全设计均来自真实用户反馈,突然窜出的猫、地上的拖鞋和线缆、蹒跚学步的小孩 —— 这些场景,实验室模拟不出来。


唯一的方法,是在真实家庭里一台一台跑,跑足够长的时间,积累足够多的 corner case,然后用这些 case 反过来迭代安全设计。


为什么是这家公司


说了这么多技术方案,一个自然的问题:为什么是蔚蓝科技先做到了?


行业或许不是不知道异构架构的潜力。


问题在于,异构计算集群没法靠集成来 ——6 颗芯片的分布式调度、不同制程之间的数据通路、算力任务在不同芯片间的实时分配,这些东西没有现成方案可以买。


你得自己设计架构、自己选芯片、自己写调度、自己做底层集成。


任何一环外包,都调不通。这不是战略选择,是能力门槛。


这帮人干过类似的事。


创始人刘维超毕业于德国波恩大学人工智能机器人专业,曾以队长身份拿下 RoboCup 人形机器人国际三连冠。其核心技术团队来自宾夕法尼亚 GRASP Lab、UIUC AI Lab、哈工大等顶尖机构。


蔚蓝科技创始人曾带队拿下 RoboCup 三连冠


蔚蓝科技成立 7 年,机械、电子、执行器、软件、算法、智能体操作系统 —— 关键领域全部自研。


2021 年,第 2 代工程机 C200 打破美国 MIT 四足机器人奔跑速度世界纪录 —— 证明中国团队做得出顶尖运动控制


2022 年,国内首个四足机器人量产工厂建成投产,关键部件全部自主研发制造


2023 年,BabyAlpha 以手机价格带上市 —— 全世界第一款真正进入千家万户的机器狗


2024 年,全国首家消费级具身智能零售门店落地南京德基广场,产品完成规模化市场验证


2025 年,BabyAlpha 在家庭消费市场始终保持销量第一、使用时长第一、用户活跃度第一


初代 BabyAlpha 量产下线


这么多 "第一",蔚蓝不是拿来炫耀。每一个第一,都是在回答同一个问题:机器人怎么才能真正走进家庭。


而 BabyAlpha A3,就是这些问题走到今天给出的答案。


消费级量产,才是真正的 AI 炼金炉


蔚蓝坚定选择从消费级切入 —— 万元左右零售价,不依赖 ToB/ToG 先跑规模。


这是最难的路。


ToB/ToG 订单大、付款稳,但场景封闭、迭代慢。


消费级意味着:技术必须便宜到普通人买得起、可靠到普通人敢放在家里、聪明到普通人愿意天天用。


行业很多公司还在 Demo 阶段,蔚蓝已经卖出了 2.5 万多台(其中家庭用户占比 90%)。用户累计使用时长超 9.5 亿分钟,累计交互次数超 6,500 万次


这并不是简单的市场数据,而是一个飞轮的起点 ——


每卖出一台,真实场景数据就多一分,算法就迭代一步,产品就更聪明一程。


智能算法不是在实验室走廊里调的,是在真实家庭的拖鞋、线缆、玻璃门之间迭代出来的。


后发者要追赶的,不只是技术,是上万台设备先跑出来的真实世界经验。



“The next big thing will start out looking like a toy”


三年前有人说 BabyAlpha 是玩具,三年后我们或许正在见证这句话的后半段。


感知、算力、自主能力,A3 把这三条线第一次在消费级产品上拧成了一股绳。


不是实验室里的三个 demo,是同一台万元机器狗上的完整系统。


这意味着什么?


消费级具身智能的临界点,不在实验室,在普通人的客厅。


不是 "看起来像智能" 的遥控玩具,不是 "参数很好看" 但跑不动大模型的摆设,是一个普通家庭买得起、放在家里真正有用、每天用会越来越懂你的智能伙伴。



Q3正式上市,到时候见真章。


阅读全文,关注官方渠道获取更多新品资讯。


© THE END

转载请联系本公众号获得授权

投稿或寻求报道:liyazhou@jiqizhixin.com