阿里发布 Qwen3.5-Omni,多模态能力超越 Gemini-3.1 Pro

摘要

3 月 30 日,阿里发布千问新一代全模态大模型 Qwen3.5-Omni,在音视频理解、识别、交互等 215 项任务中取得 SOTA(性能最佳),超越 Gemini-3.1 Pro,成为目前全球最强的全模态大模型之一。

3 月 30 日,阿里发布千问新一代全模态大模型 Qwen3.5-Omni,在音视频理解、识别、交互等 215 项任务中取得 SOTA(性能最佳),超越 Gemini-3.1 Pro,成为目前全球最强的全模态大模型之一。新模型拥有极强的音视频理解与实时交互能力,能够对音视频内容生成详细且可控的结构化描述,可识别语言和方言数量多达 113 种,还惊喜地涌现出了音视频 Vibe Coding 能力。目前,阿里云百炼已上新 Qwen3.5-Omni 的 Plus、Flash、Light 三种 API,可广泛应用于短视频/直播平台、游戏、自媒体等行业。普通用户也可前往 Qwen Chat 免费体验,开发者和企业可通过阿里云百炼平台调用 Qwen3.5-Omni 模型,每百万 Tokens 输入不到 0.8 元,比 Gemini-3.1 Pro 的 1/10 还低。

最新文章

极客公园

用极客视角,追踪你不可错过的科技圈.

极客之选

新鲜、有趣的硬件产品,第一时间为你呈现。

张鹏科技商业观察

聊科技,谈商业。