lch
发布于 2026-04-08 / 0 阅读
0

暴力屠榜!匿名黑马HappyHorse-1.0突袭视频Arena,或为阿里淘天团队作品

今天一早,全球 AI 观察者的 X信息流被一匹 快乐马 彻底刷屏了。

在 Artificial Analysis 最新发布的 Video Arena 榜单中, HappyHorse-1.0 以前所未有的姿态完成了对行业梯队的强力清洗。

根据今天的实时数据,它在文本转视频(无音频) 赛道以 1332 的 Elo 积分空降第一,直接甩开第二名 Dreamina Seedance 2.0 近 60 分。

Image

图像转视频(无音频)赛道,它更是跑出了 1391 的恐怖高分,刷新了该榜单的历史纪录。

Image

即便是在对视听协同要求极高的有音频赛道,这匹“快乐马”也稳稳占据了全球第二的交椅,仅 次于 Seedance 2.0

Image

Image

这次事件之所以被称为暴力屠榜,是因为 Video Arena 的排名机制不是厂商自报的跑分,也不是单次 Demo 的炫技,而是基于数千名真实用户在完全不知情的情况下,对两段生成结果进行“盲测”对比得出的 Elo 体系。

关于这匹“快乐马”的真身,业内早已开启了福尔摩斯模式。

坊间盛传,该模型背后的核心推手,极有可能是由原快手副总裁、可灵技术负责人 张迪 领衔的新团队。公开资料显示,张迪于 2025 年底加盟阿里,执掌淘天集团“ 未来生活实验室 ”。

作为淘天集团的 AI 研发高地,“未来生活实验室” 是阿里电商核心算法团队(国内最大的视觉AI应用场景之一), 集结了顶尖技术人才与核心算力资源,专注攻坚大模型与多模态等前沿领域,旨在构建底层算法能力并孵化 AI Native 应用。成立仅一年有余,该团队已在国际顶会发表 10 余篇高质量论文,展现出强劲的技术爆发力。

除了团队背景,关于 HappyHorse-1.0 的技术路径也引发了深度讨论。业内盛传,该模型或采用了 Transfusion(统一多模态)架构

这一路径的核心精髓在于: 在同一个统一框架内,将 离散的文本建模(自回归预测) 连续的视觉信号(Diffusion 扩散模型) 进行深度整合。尽管该架构理论上具备“理解与生成”的双重潜力,但 HappyHorse-1.0 显然将重心压在了 极致的生成表现 上。目前,这种融合架构正成为全球 AI 实验室的竞技重心,因为它能以更高的对齐效率,在保持语言逻辑的同时,显著提升视频生成的连续性与质感。

HappyHorse-1.0 的横空出世,本质上标志着 AI 视频竞赛正式进入了“后 Sora 时代”的深水区。行业的主战场已经从单纯的“能动就行”,进化到了对物理逻辑、运动一致性以及声画对齐能力的综合考量。

在 AI 的世界里,没有永远的霸主,只有更经得起用户反复对比的算法。(转载自Z Finance)