近日,AI圈的神秘黑马终于揭开面纱——此前以压倒性优势登顶国际AI视频评测榜单的HappyHorse(欢乐马)模型,正式被阿里巴巴认领,确认该模型由阿里ATH事业群郑波团队研发。这款匿名现身、一举屠榜的视频生成模型,不仅打破了行业竞争格局,更彰显了阿里在AI多模态领域的深厚积淀,成为阿里AI全面加速期的重要标志性成果。
“欢乐马”的爆火始于一场意外的“屠榜”奇迹。4月7日,HappyHorse-1.0匿名现身第三方AI评测平台Artificial Analysis视频竞技场,凭借强劲表现横扫四大赛道,以1333 Elo分登顶榜首,全面超越字节跳动Seedance 2.0、昆仑万维SkyReels V4、可灵AI 3.0等热门模型。其中,文本生成视频(不含音频)赛道得分1383,比排名第二的Seedance高出110分;图片生成视频(不含音频)赛道更是以1413分刷新榜单纪录,展现出碾压式优势。该平台采用盲测机制,用户在不知情的情况下对生成视频进行偏好投票,其排名被认为是行业内最客观的质量信号之一。
在“欢乐马”屠榜引发全网猜测之际,阿里正式官宣认领,明确其背后的研发力量是ATH事业群创新事业部郑波团队。作为阿里巴巴副总裁、清华大学计算机系博士,郑波深耕AI领域多年,2017年加入阿里后,曾担任淘宝搜推算法负责人、阿里妈妈CTO等职,主攻大模型、多模态等核心领域,具备丰富的技术研发与团队管理经验。此次“欢乐马”的成功,正是郑波团队深耕多模态技术的成果,也印证了阿里ATH事业群整合AI核心资源的显著成效。
这款备受瞩目的模型,有着鲜明的技术优势与差异化特色。作为全球首个原生支持音视频联合生成的开源视频大模型,“欢乐马”拥有150亿参数,采用40层统一自注意力Transformer架构,可实现文本转视频、图像转视频两种模式,且均支持原生音频生成,无需后期加工。其速度优势同样突出,在单张H100显卡上生成一段5秒1080p视频仅需约38秒,同时原生支持七种语言的唇形同步,词错误率在同类开源模型中处于最低水平。实测显示,该模型在场景真实感、细节还原上表现出色,能有效降低内容制作成本超50%,适配广告素材、社媒短视频等多种场景。
“欢乐马”的诞生,离不开阿里在AI领域的战略布局与资源整合。3月16日,阿里宣布成立ATH(Alibaba Token Hub)事业群,由CEO吴泳铭亲自挂帅,整合通义实验室、千问事业部等五大板块,聚焦AI核心技术研发与落地。此次“欢乐马”内部上架阿里百炼MaaS平台,预计一周后对外发布,4月30日将开放API接口,标志着阿里在多模态视频生成领域正式发力,也彰显了其抢占AI赛道制高点的决心。

阿里认领“欢乐马”,既是对自身AI技术实力的一次公开亮相,也是其AI战略加速落地的重要信号。在AI多模态竞争日趋激烈的当下,郑波团队打造的“欢乐马”,无疑为阿里增添了重要竞争力。未来,随着模型的正式开放与持续优化,其有望在内容创作、广告制作等领域实现广泛应用,同时也将推动阿里在AI赛道的布局进一步深化,开启多模态技术商业化的全新篇章。