lch
发布于 2026-05-25 / 0 阅读
0

Gemini也叛变了,付费用户变小丑

上周,谷歌悄悄上线了一套新的Gemini限额机制,引起了众怒。

一大批订阅用户发现和Gemini聊了没几轮,就提示“您已达到当前用量限额,请等待刷新”。Linux和reddit还有知乎上网友的讨论炸了锅。

之前Gemini的限额是按条数算,按天刷新。免费用户一天5条,Pro用户一天100条,不管你怎么问,“今天的天气怎么样”还是“开发一个网页游戏”,都按一条算,反正是你多花钱就多用。

但现在不是了。

改成了算力消耗制

我是Pro用户,也收到了同样的通知邮件。

从5月20号开始,Gemini改成了基于算力消耗的计费方式

你发一句“帮我翻译这段话”和你说一句“帮我用Python写一个爬虫”,消耗的额度完全不同。系统会综合计算你的 prompt 复杂不复杂、对话有多长、用了什么功能,然后扣除对应的额度。文字对话扣得少,写代码、生成视频扣的多。

但是,消耗了多少?不能告诉你。

谷歌官方原话是限制触发速度取决于模型类型及功能负载。也就是我到底用了多少 Token?这代码耗了多少算力?用之前都不知道🤷/。Gemini也开始玩另外两家不给明确数字的玩法。

然后是限额的刷新机制也改了。

双重限额上线,5小时滚动窗口限额 + 周用量limit限额。

第一层是5小时的滚动窗口,用完额度就等5小时后刷新,第二层是是每周总量上限,一旦你这周的总消耗到顶了,只能等下周重置。

这套限额不是只卡免费用户的,还有付费的订阅用户,一大批用户上线第一天就撞上了限额。

知乎上话题《如何评价 Gemini 于 2026 年 5 月 17 日实行的新限额形式?》一天内暴涨了几十万热度,底下一位网友吐槽说自己是Pro用户,5h limit 也就是=3个低质量视频 + 2个低质量图片 + 5个简单问题的pro extend,用完之后就降级到低配的Flash-lite模型。

有网友说5小时limit大概是支撑20-30个非复杂问题,如果有图片则会消耗的更快,降到20个问题。

限额这还不是让用户最破防的操作。

打开Gemini官网套餐页,就能看到8美金/月的Plus用户,用量是免费用户2倍,20美金/月的Pro用户是免费用户的4倍用量。

蛤?之前我买个会员,Pro用户是免费版的33倍,Ultra是免费版的166倍,最起码能畅通稳定使用,现在花8美元也就是免费版的2x倍量,付费用户直接变小丑了,还不如注册两个账号。

这波操作上线之后,舆论失控了。

不止是Gemini,谷歌家的AI编程工具Antigravity那边同样被网友骂疯了。新的算力消耗制上线后,Pro用户发现5条对话就能烧掉50%的5小时额度,连续聊上10分钟也会撞上限额。大批用户纷纷吵着要退订。因为同样的话费,服务明显降级变少。

而且因为Flash和Pro模型额度被合并进同一个池子,限额感知更强。

很多人可能不太了解Antigravity,它是谷歌家的AI编程产品,IDE和CLI两种形式都有。一个很大的卖点是你订阅谷歌的Pro或Ultra套餐,不光能用Gemini,还能直接切换到Claude Sonnet、Claude Opus、GPT-OSS这些第三方模型,不用额外付费,不用API  ,直接能用到claude家的模型,好多人也是冲着20美金用上Claude Opus来的。但是,所有模型共享同一个额度池。

其实,Antigravity的限额收紧比Gemini早得多,从去年12月就开始了,26年3月份已经有用户发现高级模型的刷新周期从5小时悄悄变成了按周,之前还能5小时一刷,现在就得等一周。

紧接着为了平息怒火,谷歌两天内连着加了两轮3倍额度。

网友对Gemini到底降了多少额度做了一个简单总结。总之就是大家的结论一致,还是比以前少。

如果你以为只有谷歌一家在抠,那就大错特错了。

往旁边看一眼,OpenAI和Anthropic也在干类似的事。今年4月,Codex从按消息收费改成了按token计费加积分制,Pro也拆成了100美金和200美金两档。用完了可以买积分包继续用,逻辑和谷歌几乎一模一样。

Claude那边,也把Agent SDK、GitHubActions这些产品从订阅额度里拆出来了,单独走月度积分。

三家几乎一致,都从“交月费随便用”到“交月费只是起步价,用多少算多少”的路走。超过一半以上的头部大模型公司都已经在用按量计费或混合定价了,AI订阅早就变成了云账单的逻辑。

为什么?因为算力是真的不够用。

谷歌自己造TPU,按说应该不缺,也是竞争对手的算力供应商,比如跟Anthropic签了400亿美元的TPU供应合同,但是谷歌自己的DeepMind研究团队还是要排队等算力,导致核心研究员出走。

这波限额叛变的不是谷歌,是整个AI订阅模式的蜜月期,结束了。

参考文献
[1] Google Antigravity Plans: https://antigravity.google/docs/plans
[2] OpenAI Help, using Codex with your ChatGPT plan: https://help.openai.com/en/articles/20001106
[3] Anthropic, Higher limits for Claude Code with SpaceX Colossus: https://www.anthropic.com/news/higher-limits-spacex
[4] Claude Support, use the Claude Agent SDK with your Claude plan: https://support.claude.com/en/articles/15036540-use-the-claude-agent-sdk-with-your-claude-plan
[6] linux.do, Ultra 3 小时后 5h 额度剩 20%: https://linux.do/t/topic/1760337
[7] linux.do, 3x 补丁被质疑“先缩水再补”: https://linux.do/t/topic/2219076/11
[8] linux.do, 周限触发后刷新变 4 天: https://linux.do/t/topic/1538942/5
[9] linux.do, rate limits / quota / token 池换算讨论: https://linux.do/t/topic/2219076