上月底发布的DeepSeek V4已经成为国产最强的AI大模型,但跟美国最强的大模型相比还落后不少,此前美国的评估是落后8个月。

但落后8个月的对比是跟GPT-5.5这样的大模型相比的,后者之上实际上还有一两款大模型,只不过没有全面放开给大家使用,那就是Anthropic的Mythos大模型。

Mythos大模型在一个月前的4月8日发布,由于太过强大,Anthropic公司表示不会开放给公众使用,要先给一些互联网公司及机构开放使用,用于寻找安全漏洞,后面再说开放。

这些宣传也是A家的老套路了,实际上Mythos已经在微软及亚马逊的云平台上开放了,只不过价格比Opus还要贵很多。

至于性能,Mythos确实把AI榜单的分数再提升了一个档次,尤其是软件编程上, SWE-bench Pro(最接近真实软件工程场景的评测)上,Mythos得分77.8%,Opus 4.6是57.3%, 直接提升20个百分点,比之前的Opus、GPT版本迭代提升个位数的表现已经大不同了。

Mythos为何这么强,很大可能跟参数量有关,马斯克之前暗示其参数量达到了10万亿级别,要知道V4 Pro也就1.6万亿参数量,Mythos整体规模大5倍左右。

作为对比,V4 Pro在SWE-bench Pro的得分也就是55.4分,差距相当大。

比DeepSeek V4体量大5倍 中国AI距离最强AI模型Mythos还落后6-12个月

那国产的AI什么时候能追上Mythos这种级别的AI大模型?Anthropic公司的CEO Dario Amodei日前在美国的一场活动上并表示,开发出与Anthropic在网络安全领域具有同等性能的AI, 美国的其他AI企业需要1-3个月,中国企业则需要半年到1年左右时间。

6-12个月的时间比之前V4 Pro落后美国顶级AI大约8个月的说法要更长一些,但考虑到Mythos的强大,这个说法倒也不算黑中国企业AI,甚至相当乐观,Anthropic虽然对中国企业很敌视,但认知也还是清醒的,没有那么无脑黑。

不论是DeepSeek还是Kimi、Qwen、智谱、MiniMax等国内AI公司,对中美之间的差距也是相当清醒的,一方面是算力和资金远不如美国顶尖企业,另一方面是高质量的世界知识数据也落后一些,这些只能靠加大投入、创新算法等来解决,是需要时间的。

自 快科技

更多阅读:

  • :2025年2月DeepSeek访问量达5.25亿次 超ChatGPT成全球增长最快AI工具
  • QuestMobile:2024年AI大模型应用增长迅猛 DeepSeek月活跃用户达1.8亿
  • Anthropic:企业AI市场API收入占八成,2028年有望盈亏平衡
  • Anthropic:Claude Opus 4.1编程性能达74.5%
  • Anthropic:2026年收入破300亿美元拟自研AI芯片
  • 2026年OpenAI估值8520亿美元遭投资者质疑
  • Anthropic:2026年4月估值或突破9000亿美元
  • DeepSeek:2025年使用率从50%暴跌至3%
  • OpenRouter:2026年上周全球AI大模型调用量20.4万亿Token,环比增20.7%
  • 国家网信办:2025年大模型个人用户注册31亿,超全国人口2倍
  • DeepSeek:V4-Pro编程能力达开源第一,全球第九
  • The Information:2024年人工智能领域应用开发商估值倍数上升 基础模型公司倍数下降
  • Anthropic:研究表明AI聊天机器人可能会充满自信地对你撒谎
  • OpenRouter:2026年上周全球AI大模型调用量27万亿Token,环比增18.9%
  • 科大讯飞财报:2025年Q1科大讯飞营收46.58亿元 净亏损1.93亿元