
6 月 22 日,阿里巴巴发布视频生成模型 HappyHorse 1.1,较 1.0 版本,在动态表现力、主体一致性、指令遵循、视觉质感和音频能力等维度系统性升级。
6 月 22 日,阿里巴巴发布视频生成模型 HappyHorse 1.1,较 1.0 版本,在动态表现力、主体一致性、指令遵循、视觉质感和音频能力等维度系统性升级。

动态表现力是当前视频生成模型的共同难点。针对 1.0 版本部分画面动作迟缓、节奏不足的问题,1.1 版本优化了运动建模与时序一致性能力,提升了动作的连贯性和力量感。


对于内容生产者而言,保持主体一致性可大大减少抽卡率。1.1 版本支持 9 张角色参考图同时输入,保持商品细节、品牌元素、角色与场景的灵活组合和稳定性,多分镜与 N 宫格参考理解增强。这意味着在多角色短剧、直播带货、多人物广告等场景中,角色「变脸」情况可控。
在指令遵循方面,无论是简短描述还是复杂叙事输入,1.1 版本对提示词的理解能力都有所增强。比如对于打斗等高强度动态场景,简洁的提示词便可理解。对于复杂提示词,镜头编排稳定性增强,可高质量完成多场景、多角色的连贯演绎。

1.1 版本还在视觉质感和音频上做了专项优化。此前用户反馈集中的「油光感」「过度锐化」等问题得到显著缓解,保留了痘印、法令纹、毛孔等细节的真实感,可满足短剧、广告等对画面质感要求高的场景。台词表达更加自然,语速、停顿、语气能够根据场景与情绪变化动态调整。用户亦可在提示词中描述背景、环境音效等。
在技术规格上,HappyHorse 1.1 与 1.0 版本一致,单次生成时长 3 到 15 秒,支持 720p 和 1080p 分辨率和自由宽高比。自发布以来,该模型已服务覆盖短剧制作、电商广告、品牌营销、游戏 CG 等内容生产场景,模型能力仍在不断迭代升级。HappyHorse 官网(https://www.happyhorse.cn/)、阿里云百炼(https://bailian.console.aliyun.com/)和千问云(https://www.qianwenai.com/)已接入最新版本。
即日起,HappyHorse 联合虎鲸文娱集团举办「Horsepower」AI 影像大赛,优胜者将获百万商单合作,由著名导演、制片人张纪中等担任评委,诚邀海内外 AIGC 创作者加入,用户可在 HappyHorse 官网报名。



