lch
发布于 2026-05-20 / 0 阅读
0

Gemini 3.5 Flash 上线,全面跑赢 3.1 Pro,性价比最佳!谷歌还做了自己的 Claude Code

凌晨1点,谷歌举办 I/O 开发者大会。

照例,信息量巨大。模型、产品、硬件、工具,加起来十几项。

这篇文章,挑几个重点,挨个说说。

Gemini 3.5 Flash ,速度4x,性价比炸裂

今晚主角。

大会上发布的几乎所有产品,底座都换成了3.5 Flash。

I/O 2024 发布 Gemini 1.5 Flash,主打轻量高速版。

I/O 2025 发布 Gemini 2.5 Flash,主打深度推理。 

I/O 2026 不出所料,发布 Gemini 3.5 Flash,主打编程和Agent能力。

众所周知,Gemini 的产品线分两条:Flash 主打快和便宜,Pro 则定位旗舰最强。

结果这次 Flash 直接把上一代旗舰 3.1 Pro 给超了。

Gemini 3.5 Flash 成绩单表现:

  • 代码(Terminal-Bench 2.1):76.2%
  • Agent 任务(GDPval-AA):1656
  • 工具调用(MCP Atlas):83.6%

更详细的榜单结果如下——

结论相对明了,3.5 Flash属于谷歌防御性发布,对标另外两家旗舰水平GPT-5.5 和Opus4.7。

特别提一下,多模态理解(MMMU Pro):81.2%,全球第一。多模态还得是Gemini呀。

速度方面,Pichai 原话:输出速度是其他前沿模型的 4 倍,每秒289 token。没点名是谁,但懂的都懂。

在大家最关心的价格上,比上代旗舰强,比上代旗舰便宜。输出成本是 Claude Sonnet 的六折。

  • 3.5 Flash:输入 $1.50 / 输出$9.00(每百万 token)
  • 3.1 Pro(上代旗舰):输入  $2.00 / 输出$12.00
  • Claude Sonnet 4.6:输入 $3.00 / 输出$15.00

性价比这块儿,没得说。

这是Arena AI发布的一张评测图,可以看出,在智能水平、速度、成本,3.5 Flash都是性价比最佳选择,又快又便宜又够强。

而且今日就能用上。Gemini App、Search、API、AI Studio,全线可用。

以前大家说Flash,第一反应是低价、低延迟、轻量。但这次谷歌已经把自家AI产品底座模型都替换成了3.5 Flash了,3.5 Flash是Google Agent系统里的默认选项。

PS:3.5 Pro正在路上,预计下月开放。

Antigravity 2.0,谷歌版Claude Code

这个产品去年就有了。但这次 I/O 直接升到 2.0,并且给了很大篇幅介绍。

看完整场发布会,你问我:AntiGravity 是什么?

我的答案是:谷歌版的 Claude Code。

准确说,它升级成了一个以 Agent 为核心的开发环境。

Antigravity 2.0的核心能力:

  • Dynamic Subagents:可以派生子 Agent 并行执行任务;
  • Scheduled Tasks:后台定时自动化;
  • AgentKit 2.0 SDK:开发者可以自定义 Agent 行为,部署到第三方基础设施。

若想使用Antigravity 2.0,有三种方式。

第一种,全新独立桌面应用。图形界面,可以自动编排多个 Agent 。

第二种,Antigravity CLI。适合偏好终端操作的用户。

第三种,SDK。把 Harness 的能力嵌入你自己的代码,部署在你自己的服务器上 。

谷歌在台上展示了一个案例:用 Antigravity 2.0 在 12 小时内搭出了一个能跑的操作系统内核。

过程中自动启动了 93 个子 Agent,并行干活,处理了数十亿 token ,总成本不到 1000 美元 。

Google 这次把 Antigravity 放在 I/O 重点位置, 意在收束开发者入口。

过去Google的AI开发工具线有点散: Gemini CLI、Gemini Code Assist、AI Studio、Android Studio、Vertex/企业平台、Antigravity,各有各的入口。

现在要把开发者、未来Agent能力、SDK统一并到Antigravity这条线上。

一个是挽救并补齐AI Coding工具赛道已经掉队的事实;二是抓入API token调用量和云收入。和 Anthropic 押注的Claude Code 是完全同一个逻辑。

Gemini Spark,后台24/7自动替你干活

Spark是 Gemini APP新加的一个模式。

Antigravity是开发者侧的Agent 工作台,Spark便是消费端的。

Spark模式,也是这次大会的看点之一,定位很清楚:持久化 AI Agent,跨应用自主工作,不再是被动等指令的助手。

24/7 在线替你干活不新鲜,Spark的优点是你可以关机电脑,任务不停。

你交代一个任务,Spark会在后台持续推进。关掉电脑,任务不一定停,回到手机、浏览器、Gemini App,它还能继续把状态交回来。

本地 Agent 很容易被电脑状态绑死,电脑关了,任务就断了。Spark 直接把任务搬到了 Google Cloud 上跑。

因为跑在云端,能直接调用 Google 全家桶Gmail、Docs、Sheets、Calendar、Chrome、Android,跨多个应用做任务。

后面还会通过 MCP 接第三方工具,比如 Canva、OpenTable、Instacart。

Android 上会有一个叫 Android Halo 的新 UI 区域,用来查看 Spark 这类 Agent 的实时更新和任务进度。

关于Gemini APP 订阅套餐,新增$ 100/月 的 Ultra 套餐,原来$250 的顶级版降到 $200。

Gemini Omni,DeepMind 的世界模型

这个是 DeepMind CEO Demis Hassabis 亲自上台讲的,能让 Demis 亲自讲的东西,级别不一般,是这次发布会第一个出场的模型。

Demis 给予这个模型的定位是 World Model,世界模型。

这个词 Google 以前很少这么直接拿到发布会上讲,之前有Genie 2、Genie 3,能用文本生成一个可探索的 3D 世界。但是Genie 服务的是 agent 训练、机器人仿真、游戏环境,普通用户基本碰不到。

这次Omni 的关键词是:any input to any output。

不用从一段 prompt 开始,一段文本、几张图片、音频、视频,可以同时混着作为输入,Omni理解这些素材之间的关系,然后生成或修改。比如,把视频里的动作、人物、场景都换掉。

Genie 是造世界,Omni是编辑世界。

Hassabis 说了句关键的话:World Model 的终极目标是训练机器人。

模型理解了物理世界,机器人就能先在模型里练,再去真实世界干活。

野心很大。

Search,把Antigravity塞回搜索框

最后是 Search,谷歌本家业务。

Google 官方说,这是 25 年来搜索框最大的一次升级。

今天起,AI Mode把 Gemini 3.5 Flash 作为全球默认模型,新的搜索框会动态展开,可以承接更长的输入,也可以接文字、图片、文件、视频,甚至 Chrome tabs。

过去,搜索框的核心是关键词。现在,Google直接让用户把更完整的意图、更复杂的材料、更长的上下文都直接塞进去。

搜索框是最核心的资产。用户的需求从这里开始,广告、购物、本地服务、地图、YouTube、酒店、机票,后面所有东西才接得上。

所以这次 Search 升级,本质上是 Google 的入口防守战。

新能力主要分两条。

第一条,information agents。

用户可以在Search里创建多个信息Agent,让它们在后台持续监控网页、新闻、博客、社交、金融、购物、体育等数据。

比如找公寓、盯价格、追新品、看比赛动态、跟某个行业变化。这些任务以前要反复搜。现在Google想让Search自己盯。

第二条,generative UI。用户问一个复杂问题,Search会把Gemini 3.5 Flash和Antigravity的能力接进来,直接根据用户的问题实时生成交互式视觉工具、表格等。

今年夏天,这类 generative UI 会免费向所有 Search 用户开放。

最后

这场发布会,谷歌的方向很统一。模型已经是基础设施,Agent 才是产品。