lch
发布于 2026-05-18 / 0 阅读
0

装上就有6个AI“牛马”帮你干活?腾讯Marvis内测

马维斯形象照。图片经过AI处理

文丨苏扬

编辑丨徐青阳

5月12日,应用宝的Marvis团队介绍了中文名叫作“马维斯”的Agent产品。

“它叫Marvis,蹭了一下Jarvis的概念。”产品负责人王秋阳说,“由于没有牛马这种动物,我们就画了一个,去掉了马的鬃毛,换成小牛角,它戴着腾讯系的红围脖儿,还蛮可爱。”

根据介绍,马维斯可以归类、解析文档,智能分类识别、处理图片,能修电脑(操作系统),市面上Agent能做的,马维斯基本都能做,比如它能做的:对操作系统架构、文件所有的理解,依据任务来调度模型、桌面操控收集应用、移动端“云监工”等能力,其他Agent产品不一定现在就有。

马维斯产品能力介绍

沟通会上提及最多的词就是“操作系统层级AI助手”,我觉得它可以用来概括马维斯的核心能力。

“我们是一个贯穿于操作系统层级的AI、个性化的 AI 助手,而不是一个像 AI PPT,或者像类似于做一个龙虾(Openclaw)一样的产品。”马维斯业务负责人蔡建涛说。

演示各种电脑操控的时候,我的感受是:哦,原来这是一个可以“修电脑”的Agent。

但准确一些的说,可以把马维斯看做是一个掌握系统“资源管理器”的AI助手——用户能够直接用它管理文件、理解文档、修改设置、执行任务,甚至操作Android应用。

可能有不少朋友用过NAS,现在很多NAS也有一些基础的智能引擎来管理存储里面的图片、文件了,马维斯就像这样一个产品,但它可以直接“套”在你的电脑上,而且装上就能干活,无需费劲去找skills。

 

01

马维斯能做的事情

一个对话框,一个工具列表,一个会话历史,就是马维斯的产品轮廓,你要强行从“长相”上找出它与其他Agent助手有什么分别,不一定有答案。

马维斯业务负责人蔡建涛说:“可能让大家觉得就像很多AI产品都是一个框,Chatbot是一种类型,编程工具IDE是一种类型,这些都可以不要,希望用户将来在某一个设备里,通过简单的语音对话,它就可以完成你需要的大部分的操作。”

这是蔡建涛的远期目标,但现阶段马维斯能做的,是一个成为Agent版“资源管理器”——接入系统来管理文档、图片、生成内容、执行任务。其中,文档分成课件数据、简历报告、合同书籍、票据证明等,图库可根据图像的Meta信息、图像含义、OCR文字等进行主题归类。

客观地说,这些能力其他Agent现在也都能做。

不过,马维斯有一点不同:它可以利用路由机制,自动分配不同重量级的任务给不同的模型,一部分模型在本地,拔网线也可以用。

我在很多稿子里都提到过“烧Token”的困扰,马维斯试图从产品层面解决“Token消耗”问题,当然,这也要求硬件足够“硬”,因为它预装了很多本地模型。

问题是,为什么马维斯要这么做?

还是前面说的“系统级”这个原因——应用宝与操作系统、底层硬件提供商保持着长期的合作,即便是小模型都能够得到快速的适配,并且能够获得访问系统底层的授权。

所以,马维斯像一个能“修电脑”的Agent,但又与市面上的产品不同,由于Windows系统、硬件对马维斯开放了访问权限,它可以读到软、硬件的信息。

马维斯核查电脑配置演示

产品负责人王秋阳演示了一个Demo,用户想玩“黑猴”,但不知道硬件能否带得动,马维斯可以感知电脑硬件配置,然后联网搜索游戏的配置要求,再向用户反馈结果。

还有一个我觉得不错,王秋阳在现场一再强调不是很高频,但又很有效的能力——关Windows广告。

通过马维斯关闭Windows系统广告

同样的问题,你问聊天机器人,它会给你一步步的文字指南,但不会替你去做;其他Agent类产品,可能也会去做这件事,但中间可能会要很多授权,有些模型还会一顿表演性输出,给你提供小作文,最后索要权限,或者是提供一行代码让你自己“终端”执行。

马维斯在接到指令之后,是真的去把这个“关广告”任务给做了。

还有一个不错的能力:针对存在隐私需求偏好的用户,马维斯提供了“隐私模式”,完全将任务固定在端侧模型上运行,就像前面说的,不需要联网。

“一些组织内部,特别是财务,处理数据的时候要拔网线, HR也不方便直接用云。”产品负责人王秋阳解释推出基于端侧模型的“隐私模式”的初衷。

另外,桌面端操作手机应用,也是马维斯的亮点之一,这也是应用宝的老“艺能”。

在桌面端跑Android应用,意味着很多任务用户不再需要切回移动端,比如签到打卡。甚至如果未来一些内置打卡领豆子的游戏,马维斯也能替你去做这件事。至于此前习惯被拿出来做案例展示的在外卖、小程序上点饮料这种操作,就更加容易了。

根据产品团队介绍,马维斯在桌面端操作移动应用,不会和用户抢键盘鼠标,而且可以多开,所以只要你的硬件性能够强,应用接口足够丰富,马维斯这种桌面Agent,很有可能帮助PC产业,从移动设备手中,“抢”回一部分用户使用时长。

 

02

它有什么不一样?

前面虽然说马维斯的界面和市面上的产品差不多,但其实从这款产品上,还是可以看到一些新颖的元素——一个卡通风格的Agent工作室,根据Agent的角色、工作状态不同,设置了不同的动效。

马维斯和它的Agent小伙伴

Demo演示的时候,官方演示了一个“团战”的画面——预设的6个Agent组成了一个小团队,包括戴红围脖的团队主Agent,戴绿围脖的电脑操作Agent等等,甚至还有Agent在“闲聊”。

“他没有什么正事儿干,一会儿可能会去上厕所,或者是喝咖啡,或者跑步,有时候他会交流一些实操的经验。”

介绍到这个点时,现场哄堂大笑,当时我就在想,能让大家都笑起来,说明这就是一个能够引起用户关注的特色。

“我们知道具备执行能力的AI Agent是完成大量长程或者中长程任务,时间稍微长一点,比如分钟级别的任务,用户就是会等待,这个时候就需要有一些信息呈现。”马维斯团队这样解释给Agent画了一间卡通风格的办公室,设置不同的角色和状态的思考。

视觉差异和用户体验不强相关,真正的差异还是一直提及的“操作系统层级Agent助手”概念。

“我们天然是一个贴近硬件,贴近生态的团队。马维斯不是一个拍脑袋想出来的概念产品,它是团队在既有基因和生态位上‘长’出来的。”产品团队如此介绍。

据了解,马维斯背后的应用宝团队,与微软、英特尔和高通产研团队深度协作,专门优化端侧模型的推理效率。

大家使用聊天机器人,Agent助手,最常用的功能就是给他上传文档,对吧,在马维斯这个产品里面,不需要上传这个动作,因为它本身就是一个“资源管理器”,所以整个操作系统对它来说,就是一个分门别类的知识库,而这就是得益于马维斯团队与合作伙伴协同研发的动作。

这也是为什么我会认为马维斯是一个“占领”资源管理器的Agent,有机会收割一部分移动产品的使用时长。

按照产品团队的说法,马维斯的能力自底向上,先做文件(解析、转换、搜索、索引),再做应用(把商店做成一个MCP,支持查询、安装、下载、卸载、打开、退出),再做系统操作(可以直接修改系统设置、诊断问题、修复故障),最后搭Agent框架。

“整套系统沿着大概规划的路径推进,到了25年12月份,我们已经回不了头了,不会再去切成Hermes、OpenClaw这样的框架。”王秋阳说。

 

03

一个选Marvis的理由

前有虾、后有马,为什么还要再装马维斯这个“牛马”?

在沟通会上被问到这个问题时,马维斯团队坦诚地表示,他们也没有“杀手锏”式的一句话答案来告诉用户必选马维斯。

就如同我们前面所说,从用户界面、功能上,大家看上去没有什么本质的不同,同类型的功能不存在A能做,B做不了的问题。比如现在的电脑操控(Computer Use)、浏览器操控(Browser Use),各家其实都在做,常规的能力大同小异。

用户在体感上很难感受到大家技术路线的差异,或者说不需要知道这种差异。

各种Agent产品,最后PK的无非就是同一种功能的前提下,谁能操作更准确、交付结果更快,以及现在大家最关心的:谁最省Token。

站在马维斯产品团队的视角,他们考虑的除了提供一个“杀手功能”之外,更倾向于提供一个长链条的场景化能力来吸引用户。

“比如电脑上的证件照目录,你点进这个目录来能干嘛?要办签证?办驾照,或者是你要裁这个图,换黑白底变蓝底?那我就把相关的能力放在这个入口,你点进来的时候大概率就是需要它,这其实就是场景化的渗到你原有的使用习惯当中。”

另外,关于马维斯的生产力属性,问到的也比较多。

前面提到了很多文档相关的能力,这其实就是生产力的一部分,所以我认为大家这么问,是想了解马维斯在编程方面的生产力表现,毕竟,这也是目前AI工具提效最有共识的领域。

“在办公这个分支我们投了很多精力,包括说可能文档的格式转换、编辑总结这一系列的东西,编码这块我们就不怎么花精力。”马维斯业务负责人蔡建涛在现场告诉大家,“我们文档能力绝对比市面上 95% 的都好很多,不会把办公所有东西做全,因为做全实在是太难了。”

马维斯的端侧隐私模式,也是现场大家重点“围观”的能力,所以也收到了很多追问。

如前面提到,开启这个功能可以在不联网的情况下使用模型,有人问这和效率模式有什么差别,我的第一感受就是,模型的尺寸不同,能力肯定有差异,本地端侧模型肯定无法和云端大模型直接对比,但端侧模型到底能做什么,特定的能力项有哪些,我认为需要在产品中,明确告诉用户,方便用户在实操中对应选择。

除了能力差别,端侧模型“零token消耗”,也是优势项,就意味着省成本嘛。

 

04

写在最后

旧时代做产品,要做得足够好才发布;但AI时代节奏太快了,做不到完美再发布,产品要边做边迭代。

按照马维斯团队的说法:2025年12月,他们从上到下、从下到上两头搭好框架之后,判断这个东西“是时候面向用户了”,于是选择在2026年5月把这个产品推出来。

所以,现在大家看到的,只是马维斯的一个雏形,未来还会有很多新能力。

只不过,从“操作系统层级的AI助手”这个角度来看,未来的能力都将集中在这个定位上。就像我们前面概括的:它是一个掌握了资源管理器的AI Agent——不止能对话,还能操作;不止能回答,还能执行;不止在云端,还在你的电脑里。

推荐阅读

腾讯新闻CLI上线:把“智能资讯”装进你的终端

拥有一只懂新闻资讯的“小龙虾”,有多酷?

财报会9天后,腾讯亮出“龙虾闪电战”底牌