阿里发布 Qwen3.5-Omni，多模态能力超越 Gemini-3.1 Pro

3 月 30 日，阿里发布千问新一代全模态大模型 Qwen3.5-Omni，在音视频理解、识别、交互等 215 项任务中取得 SOTA（性能最佳），超越 Gemini-3.1 Pro，成为目前全球最强的全模态大模型之一。新模型拥有极强的音视频理解与实时交互能力，能够对音视频内容生成详细且可控的结构化描述，可识别语言和方言数量多达 113 种，还惊喜地涌现出了音视频 Vibe Coding 能力。目前，阿里云百炼已上新 Qwen3.5-Omni 的 Plus、Flash、Light 三种 API，可广泛应用于短视频/直播平台、游戏、自媒体等行业。普通用户也可前往 Qwen Chat 免费体验，开发者和企业可通过阿里云百炼平台调用 Qwen3.5-Omni 模型，每百万 Tokens 输入不到 0.8 元，比 Gemini-3.1 Pro 的 1/10 还低。