lch
发布于 2026-04-10 / 0 阅读
0

Meta归来!时隔一年发布Muse Spark,重回第一梯队

专注AIGC领域的专业社区,关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,聚焦LLM的市场研究和AIGC开发者生态,欢迎关注!

Meta刚刚发布了Muse Spark模型。

这是扎克伯格重金打造的MSL(Meta Superintelligence Labs)团队的首款模型。

距离Llama 4系列发布,过去整整1年,Meta又回来了。

这一年间,Meta AI经历了从“失望”到“重生”的剧烈转型。

Llama 4虽是首款原生多模态、MoE架构模型,支持长上下文和多语言,但发布后基准测试表现平平、被业界广泛视为未达预期。直接刺激扎克伯格在2025年夏季启动全面AI重组。

2025年6月30日,Meta正式成立Meta Superintelligence Labs,由扎克伯格亲自推动,目标直指“个人超级智能”。

他通过140亿美元投资Scale AI,引入29岁前CEO Alexandr Wang担任首席AI官,同时招募前GitHub CEO Nat Friedman等顶尖人才,展开大规模“人才战争”,投入数十亿美元重建训练基础设施和技术栈。

MSL从零起步,摒弃部分Llama遗留路径,专注于高效 scaling、视觉链式思考、工具使用和多代理编排。

经过近9个月闭门研发,Muse Spark作为Muse系列开山之作应运而生。

它在写作、推理、视觉STEM等领域性能大幅超越Llama 4,计算效率提升一个数量级。

Alexandr Wang都激动得连发9条推文。

Yann LeCun也点赞夸奖。

Muse Spark性能如何?

在Artificial Analysis的测试中,Muse Spark拿下了52分的战绩,仅次于Gemini 3.1 Pro、GPT-5.4和Opus 4.6,排在第四。

而去年的Llama 4 Maverick只有区区18分。

多模态,文本推理,健康,智能体四个领域20个基准测试上,与顶级闭源模型打的有来有回。

模型还推出了沉思模式(Contemplating Mode)。

沉思模式下,人类最后的考试(不使用工具)以50.2拔得头筹。前沿科学研究38.3获第一。

在过去九个月里,团队通过改进模型架构、优化和数据管理,重建了预训练栈。

最终以比之前模型Llama 4 Maverick少一个数量级的计算量达到同样的能力。

如此强的模型,不开源了!Llama系列开源已成过去式。

Meta的AI战略从开源Llama,转向了闭源Muse前沿探索。

模型已在meta.ai和Meta AI App上线,API预览版向部分用户开放。未来几周接入Facebook、Instagram和WhatsApp。免费用,不限量。

Muse Spark发布,止血了Llama 4低谷,也为扎克伯格的超级智能愿景奠定基础,开始从人人可用开源转向了产品级闭源领先。

Meta重回前沿对话席位,未来Muse家族将如何迭代,值得持续关注。

参考资料:

https://ai.meta.com/static-resource/muse-spark-eval-methodology

https://ai.meta.com/blog/scaling-how-we-build-test-advanced-ai/

https://ai.meta.com/blog/introducing-muse-spark-msl/

END

点击图片立即报名👇️


图片
图片
图片
图片
图片