lch
发布于 2026-05-18 / 0 阅读
0

对话光帆科技陈康达:视觉感知耳机、AI OS、中国公司抢跑苹果|AlphaCommunity

图片



光帆科技抢跑苹果推出全球首款拥有「视觉感知能力」的AI耳机。


他们认为未来的生活是这样的:用户只要说一句「帮我打车去北京南站」,耳机会基于定位就知道你从家里出发,最常用的上车点是哪里,习惯叫快车还是专车,然后在各平台比价,和你确认下单后,几分钟后,车到了,耳机直接播报提醒车牌尾号。


全程不用再掏出手机。


「它是一个能看你所看听你所听,随时响应你、替你办事的AI助理。」光帆科技联合创始人陈康达博士说,两个月前的一场活动上,他现场演示了这个场景,用耳机一句话叫车,然后用耳机回复飞书的工作消息。


光帆这套产品叫「AI全感穿戴设备」,内部的定义更激进:不是耳机,是AI时代的「第二台主机」。


它以一台具备视觉感知能力的AI耳机为核心,再搭配一块AI手表,双设备联动实现无感交互,耳机盒还搭载了GPS4G eSIM卡、指纹模组等传感器,支持独立联网和身份验证。


这套AI可穿戴设备指明了AI硬件竞争最核心的问题:当大模型能理解自然语言,基于Agent可以执行复杂任务,下一代个人交互的入口,会不会从手机,转向一种更轻、更贴身、随时响应的终端设备?


图片



过去一年,光帆科技完成了4轮融资,累计融资额近3亿元人民币,阿尔法公社从首轮起,连续4轮投资光帆科技,它的投资方还包括联想、小鹏、韶音、歌尔、宁德系、兆易创新系等产业资本这说明它不是一个常规的硬件项目。


一个FA告诉我们,第一季度很多硬件投资人只看把各种摄像头够装到硬件上的产品,「AI时代的入口竞争已经从模型和App往『贴身终端』外溢,视觉是最重要的入口。」


行业在疯狂押注同一个方向:视觉为硬件增加更多模态,穿戴硬件被认为是承载视觉能力的合适的载体,也是落地Personal AI的最后一公里,这也是海外巨头在密集布局的原因。


但光帆科技为什么先选择做耳机,而不是眼镜?


陈康达给出了非常笃定的判断:从更长时间尺度看,眼镜是很好的载体,但今天AI眼镜的技术成熟度和用户体验都不够,重量是个大问题,同时——这是关键——很多人不愿意戴眼镜。


耳机不同,耳机是一个无感佩戴、量巨大、不用教育消费者心智的成熟品类,结合更多传感器实现更多模态之后,是当下更优的AI落地形态。


但在耳机里加入摄像头,是一个有着足够挑战性的题目。


在极小的空间里要集成摄像头、电池、麦克风、扬声器、通信模块等,同时要把重量和佩戴舒适度做到消费级水准,需要近乎极致的集成度,对结构、体积、重量、功耗、续航、算法都提出极高的要求。


苹果被曝光原定于2026年下半年发布带有视觉感知能力的AirPods 已经推迟,而OpenAI首款带摄像头的AI耳机也明确不会早于2027年。


图片



陈康达是清华和UC Berkeley联合培养博士,小米汽车早期团队成员,从01参与小米造车过程,先后参与负责过产品、战略、供应链等业务。


在小米的造车经历,让他形成了做AI硬件的两个重要感悟。


第一,消费级产品的核心仍然在于能不能坚守第一性原理,真正从消费者需求出发,共情和理解用户需求。


第二,所有过去机械属性的、离线的、单一个体的硬件,都值得用AI思考和重构一遍,成为智能化、主动式的AI硬件。


而这还不够,大模型时代需要从人机交互范式底层去思考功能,并基于交互和功能,定义传感器组合和软硬件形态才能形成真正的竞争力。


在光帆科技这套AI全感穿戴设备正式发售前,AI闹与陈康达博士进行了一场访谈,聊了聊他对AI时代新入口,以及AI硬件的思考。


图片

光帆科技联合创始人陈康达博士


「 对话陈康达 」


AI新入口在可穿戴设备

自然语言接管一切


AI闹:第一个问题,过去二十年,个人计算的入口一直在迁移:从PC到手机,再到今天大家都在押注可穿戴。为什么你们判断,下一代入口会先长在耳边?


陈康达:首先我们的判断是,今天的AI已经完全不一样了。今天以大模型为基础的新一轮AI本质上带来了一个非常底层的变化:人机交互范式的变化,即人机交互由过去的图形化交互转向AI多模态交互。它将驱动着新时代下的硬件形态、整个软件体系以及商业模式的变化,而真正的机会也来源于此。


以前我们用手机,是先有个需求,然后在脑海里拆解成一步步怎么做,再掏出手机一步步去点击。而今天,任务的拆解和执行,AI都可以做了,人只需要表达需求就可以了。当人只用表达需求的时候,这个硬件就可以做的很轻、很小,可以一直佩戴。手机就不是最好的形态了,因为手机是被动的,并且揣在口袋里。所以可穿戴硬件在AI时代将迎来一个前所未有的巨大机会。这也是海外巨头都在这个领域密集布局的原因。


更长时间尺度来看,我们把未来的AI可穿戴硬件分为两类:一类是垂类硬件,例如戒指、挂坠、腕表等,他们定向的实现一两个垂类功能;另一类是通用硬件,可以作为入口,搭载和实现大量的功能,AI时代的这类设备需要离人的耳朵和眼睛更近,真正做到Always-on


我把Always-on拆成两层,一层是你能随时随地触达到它,即你有需求的时候不用做任何多余的动作,直接说句话它就能听到并且响应;另一层是它能随时随地触达到你,例如别人给你发个消息,AI能第一时间告诉你内容,而这两层手机都没办法做到,戒指、挂坠、腕表也做不到。


所以AI时代,耳机和眼镜属于这一类通用硬件,是面向AI多模态交互更好的硬件形态。这两类硬件形态里,最初我们考虑过眼镜,但眼镜的问题是技术方案不够成熟,还是太重了,并且很多人不愿意戴眼镜。


而耳机是一个无感佩戴、量巨大、不用教育消费者心智的成熟品类,结合更多传感器实现更多模态之后,是当下更优的适合AI落地的形态。


AI闹:把摄像头塞入耳机比塞入眼镜更难——耳机体积更小,为什么用户需要一款带摄像头的耳机,它比普通的AI耳机体验好在哪里?


陈康达:确实一年多前做带摄像头的AI耳机还是非共识。


如果没有摄像头,我们也能做出AI耳机,但考虑到模态有限,就很难发挥出今天AI的全部能力。


我们内部一直用一个类比理解摄像头的重要性,就像当年智能手机里的GPS。刚开始大家会觉得,GPS只是用来导航的,但后来移动互联网时代很多核心服务——比如打车、外卖、共享单车等等LBSO2O的应用都建立在定位能力之上。


今天摄像头也一样,它让AI真正做到「看你所看,听你所听」。


比如线下吃饭,眼前有五家店,以前你要掏出手机、解锁、打开大众点评,再一个个餐厅名字输进去,看评分看评价,最后花十分钟才作出决定。但我们的耳机会很快告诉你:这家店偏辣,那家店评分更高。


再比如线下买衣服,线下店员说这件卖2000块,你戴着耳机看一眼,AI立刻告诉你,网上同款1200元,然后帮你比完价了,你可以直接让它帮你下单。还有扫二维码今天也很麻烦,停车场缴费、骑共享单车,未来简化成「看一眼」。


摄像头的引入真正做到了线上线下融合,让自然语言真正接管更多现实世界的动作。


AI你们的这套AI设备和PC、手机的关系是什么?是替代关系吗?


陈康达:我们在耳机盒上加了GPSeSIM卡、指纹模组等传感器,用户可以把它当成一个独立设备,完全不依赖于手机,独立联网,拿着耳机就可以直接调度AI做很多事,再搭配AI手表的显示,可以替代绝大部分使用手机的场景。


回头看消费电子的发展史,PC时代我们大量的工作都在电脑里做,后来智能手机出现后,大量的功能到智能手机里,同时基于触控和实时定位又催生出一些新的功能如打车、外卖等LBS应用,以及切水果等游戏。


AI时代也是同样逻辑,AI穿戴设备将从手机里拽出大量的功能和需求,将人们从高频、碎片化、繁琐的任务中解放出来,同时由于Always-on的特性,也会衍生出新的功能和需求


未来大部分的事情可能只要直接说出需求,AI穿戴硬件就会把事情做了。


但手机不会被完全取代掉,就像手机也没有把笔记本电脑完全取代掉,画个PPT还会回到电脑里去。未来一些沉浸式的、需要使用稍大些屏幕的事情——比如看视频、打游戏,还会回到手机。


AI穿戴设备将和手机会形成协同关系,在不用掏手机的时候就把很多事给做了。


图片


中国公司在AI硬件有巨大优势

AI新交互必须长在新系统


AI闹:苹果、OpenAIMeta都宣布要做带摄像头的AI耳机,结果今年全都推迟了,你们是如何做到抢跑巨头上市?核心壁垒在哪里?


陈康达:新赛道意味着新的、创业公司的机会,未来我认为中国公司将不断引领更多的科技创新。我们的核心壁垒在几个层面:硬件、软硬件融合、操作系统、应用生态,这件事的难点也来源于此。


首先硬件层面,今天中国厂商占据绝对的优势,中国有最成熟的硬件供应链、最具规模化的制造能力、最勤奋的工程师和最极致的执行力,这是今天任何一个国家都很难匹敌的。对于光帆来说,在此基础上我们还有着行业最资深的硬件团队,在这套设备上的探索也进一步领先行业至少半年到一年。不仅仅是视觉感知的引入,还有一系列AI、软硬件能力和复杂的传感器。


其次是软硬件融合能力,这一点直接决定了基础体验。尤其是融合了不同芯片、各类传感器、多个模态后,同时还要实现跨多设备的联动和协同,这也是很多从AI领域进入AI硬件领域的创业者容易忽视的。


第三是AI和操作系统,我们面向多模态交互做了一套AI原生的操作系统,它从底层就是支持多模态、面向AI交互的,而不是像过去图形化时代的安卓一样靠图形界面和触控点击交互。


第四是应用生态,基于我们的AI OS,很多应用厂商已经在上面开发AI原生的应用,以多种形式做A2A的直接开发对接。应用生态的构建也不断地在丰富我们的功能,拓展服务的边界。


AI闹:很多同行好奇如何把摄像头塞进耳机?这是一个很大的工程挑战。


陈康达难度确实非常大。在极小的空间里要集成摄像头、电池、通信模块等等,同时要把重量和佩戴舒适度做到消费级水准,这是一件极具挑战的事。另外比如摄像头的视角、结构、外观、材质、透光率等都会影响最终体验。我们其实试了很多方案,也趟了很多坑。


举个例子:普通手机摄像头外面的cover lens通常是平的,但我们的耳机是弧形的,如果还是用平面cover lens,看起来会不好看,也会让人一眼就觉得「这里有个摄像头」,侵犯感很强。现在的方案是做成了弧形,尽量和整个外观融为一体,黑色的耳挂也是为了尽量和头发融合,让整体耳机造型看起来像一个悬浮的水滴。


但摄像头cover lens做成弧形,透光率、识别效果都会受影响,所以我们在材质、结构参数和算法调校上花了很多时间。包括如何把各类器件重新组合起来,重构lay out、通信链路、调整结构,以及在各种环境下保证成像和识别稳定,都需要大量的技术攻关和调试。


最终的产品重量只比普通挂耳式耳机重了大概2克,用户戴上基本是无感的。而这也构建了AI穿戴设备最重要的特性——长时间佩戴。


AI闹:你们提出「AI原生操作系统」——为什么不在现有系统上做一层AI封装,非要开发一个新OS


陈康达:核心还是人机交互范式发生了变化,旧时代的、面向图形化交互的安卓和iOS已经很难适用于今天的AI多模态交互,同时过去历史上每一代OS都很难基于上一代改出来。这里面有非常多的变化,固有的架构也很难支持。


我们相当于面向AI多模态交互做了一个新的原生OS,原生意味着自由度、准确率和算力效率。


一头连接人。跟人做交互,并不断了解人的信息、理解人的需求。这需要一整套人机系统工程学去保证,也有很多新技术难题需要去解决。


另一头连接各类Agent。我们的观点是不可能自己做所有的事情,要让专业的人做专业的事。你不可能比携程更懂如何订机票,也不可能比滴滴更懂如何打车。所以我们做的是搭一套底层基建,让应用厂商基于此更快、更高效的开发自己的AI应用,同时把需求准确分发给不同的服务Agent,做业务流和业务流的对接。


之后AI OS会做成开放平台,类似苹果商店,更多的开发者可以在上面开发AI原生应用。


水大鱼大,速度第一


AI闹:说句玩笑话,华强北在焦急期盼你们上市,一旦产品形态被验证,山寨版三个月就能上架,价格还是你们的三分之一。


陈康达:这方面我们完全不担心。我刚才说了这套设备硬件本身的壁垒其实也非常高,整个跑通不容易。再者,硬件可能有一天会被赶上,但在软硬件融合、操作系统和应用生态上,一般厂商很难有机会。软件定义硬件,AI和软件能力决定了AI硬件的上限。


过去耳机一直作为手机的配件,能实现的功能只是连接手机,打电话、听音乐。软硬件方案相对成熟,技术壁垒没有那么高,所以市场一直非常分散。


但是未来AI会把可穿戴硬件从一个分散的配件市场,推向一个更集中的通用硬件市场,拥有以前所不具备的功能,竞争也从「硬件」变成「AI 、软硬一体、和数据」的比拼,已经不是简单的代工厂层面的竞争。


我们判断,未来AI 耳机市场,包括AI 可穿戴市场,可能会越来越像手机市场,呈现二八定律,慢慢形成头部效应。


AI闹:很多用户担心隐私,耳机知道我住在哪里、去了哪里、看到了什么,相当于全天候的监控设备?


陈康达:未来的AI就像你的助理一样,它越了解你,可以帮你做的事越多,这一定是大势所趋,跟过去支付方式的变迁如出一辙。当然我们做了极严格的隐私保护。


首先耳机上的摄像头我们选择的参数只有200万像素,主要是做物体感知和识别,而非记录。它也会拍照,但照片消费者看不到,识别完物体提取参数后,照片「阅后即焚」。


其次,我们在耳机盒上加了指纹模组,只有指纹匹配后,AI功能才会被唤醒。否则别人捡到你的耳机,只能当普通蓝牙耳机用,无法唤起AI,也无法调出你的任何数据。同步地,我们的声纹识别技术也很快就会落地。


AI闹:苹果现在押注三个智能终端:眼镜、AI挂件、带摄像头的AirPods,这不是暗示下一代硬件入口很可能不是单一入口而是一个对生态设备?


陈康达:苹果也在探索,但我们的总体判断和你刚才说的类似。未来穿戴设备会承载大量的功能和需求,但也很难把所有功能都塞进一个硬件里。所以未来可能会是分布式的,端侧不同形态的硬件设备,承担不同的功能。云端同一个「大脑」理解和记忆人的需求,调度不同设备和不同服务。


但就像前面说的,耳机和眼镜我们的判断是有潜力作为通用设备,去承载更多功能、需求和数据。


AI闹:如果五年后用户每天最先接触的不再是手机而是各种可穿戴设备。在入口迁移的过程中,初创公司,你觉得最该避免的错误是什么?


陈康达:平庸。AI时代水大鱼大,我们希望做这个时代最前沿的科技公司。不做平庸的产品是一种信念,非共识往往意味着机会,哪怕早期看上去稍微有点激进。同时,迭代速度要快,「专注、口碑、极致、快」在任何一个创业年代都不过时。


本文内容转载自AI闹,作者张卓。


图片

图片
图片
图片
图片
图片
图片
图片
图片
图片
图片
图片
图片
图片
图片
图片


图片
图片