Anthropic：最新评估中国AI落后Mythos模型6-12个月

上月底发布的DeepSeek V4已经成为国产最强的AI大模型，但跟美国最强的大模型相比还落后不少，此前美国的评估是落后8个月。

但落后8个月的对比是跟GPT-5.5这样的大模型相比的，后者之上实际上还有一两款大模型，只不过没有全面放开给大家使用，那就是Anthropic的Mythos大模型。

Mythos大模型在一个月前的4月8日发布，由于太过强大，Anthropic公司表示不会开放给公众使用，要先给一些互联网公司及机构开放使用，用于寻找安全漏洞，后面再说开放。

这些宣传也是A家的老套路了，实际上Mythos已经在微软及亚马逊的云平台上开放了，只不过价格比Opus还要贵很多。

至于性能，Mythos确实把AI榜单的分数再提升了一个档次，尤其是软件编程上， SWE-bench Pro（最接近真实软件工程场景的评测）上，Mythos得分77.8%，Opus 4.6是57.3%， 直接提升20个百分点，比之前的Opus、GPT版本迭代提升个位数的表现已经大不同了。

Mythos为何这么强，很大可能跟参数量有关，马斯克之前暗示其参数量达到了10万亿级别，要知道V4 Pro也就1.6万亿参数量，Mythos整体规模大5倍左右。

作为对比，V4 Pro在SWE-bench Pro的得分也就是55.4分，差距相当大。

那国产的AI什么时候能追上Mythos这种级别的AI大模型？Anthropic公司的CEO Dario Amodei日前在美国的一场活动上并表示，开发出与Anthropic在网络安全领域具有同等性能的AI， 美国的其他AI企业需要1-3个月，中国企业则需要半年到1年左右时间。

6-12个月的时间比之前V4 Pro落后美国顶级AI大约8个月的说法要更长一些，但考虑到Mythos的强大，这个说法倒也不算黑中国企业AI，甚至相当乐观，Anthropic虽然对中国企业很敌视，但认知也还是清醒的，没有那么无脑黑。

不论是DeepSeek还是Kimi、Qwen、智谱、MiniMax等国内AI公司，对中美之间的差距也是相当清醒的，一方面是算力和资金远不如美国顶尖企业，另一方面是高质量的世界知识数据也落后一些，这些只能靠加大投入、创新算法等来解决，是需要时间的。

菜单