多款创新技术产品发布,领航 AI 汽车新征程
11 月 27 日,2024「绝影实力 AI DAY」成功举办,商汤绝影全面展示了「驾-舱-云」三位一体的通用人工智能(AGI)产品体系与战略布局,发布智能座舱交互革新、端到端智能驾驶等前沿领域的创新成就,领航 AI 汽车新征程。
在本届「绝影实力 AI DAY」上,商汤绝影行业首发智能座舱大模型创新产品「A New Member For U」(你的家庭新成员),让汽车拥有「有趣的灵魂」。面向智能驾驶,商汤绝影构建了「车云一体」的产品矩阵,发布涵盖高速、城区以及泊车等全场景的高阶智驾、端到端智驾等绝影量产智驾产品体系,同时全新升级行业标杆级别的「开悟」世界模型,以此打造坚实的数据基础设施。
作为最专注汽车行业的 AI 公司,商汤绝影同时具备丰沛算力、原生汽车垂类大模型研发能力、高质量数据体系和丰富量产经验等全栈实力,全力以赴推动大模型上车,打造领先的 AI 汽车创新技术和产品,给座舱以温度,让智驾更自由。
商汤绝影 CEO、商汤科技联合创始人、首席科学家王晓刚表示:「我们已经站在 AGI 时代的门口。作为加速智能汽车驶入 AGI 时代的战略合作伙伴,商汤绝影将牢牢把握住新一轮智能汽车变革的时间窗口,与车企伙伴进行全方位深度合作,共享大算力与大模型,共建数据基础设施,共同打造智能汽车大模型创新应用,才能携手共赢,领航未来。」
A New Member For U,绝影让智能汽车拥有「有趣的灵魂」
大模型上车伊始,它们主要扮演着工具的角色,为用户提供基础的对话、信息查询和问题解答服务。随着技术的不断进步,具备逻辑思考和通用任务处理能力的 AI Agent 出现了,能够根据用户的指令,完成复杂的连续性任务,成为能干的助理。不过,这类车机都只是听话和服从的「被动智能」。
在 2024「绝影实力 AI DAY」上,商汤绝影用领先的 AI 实力重新定义座舱,不只是赋予汽车以智能,更赋予智能以温度。未来,它不再只是冰冷的工具或者机械式的助理,而是「A New Member For U」,成为会察言观色、无时不在且与你心有灵犀的「家庭新成员」。
这位「家庭新成员」能够感知和理解用户需求,提供有温度、有情感的主动关怀。可以畅想这么一个场景:在驾驶旅途中,「家庭新成员」注意到坐在后排的孩子睡着了,就会主动把空调温度升高、音乐的声量调低,底盘和驾驶模式都调整为舒适模式,给小朋友一个舒适安心的睡眠环境。
依托原生流式多模态大模型、车载类人记忆框架和持续运行框架等前沿 AI 大模型技术,商汤绝影正在引领座舱交互体验的革新,让智能汽车拥有「有趣的灵魂」。
New Member「新成员」能够察言观色,离不开商汤绝影强大的原生流式多模态大模型。在 OpenCompass 多模态评测榜单中,绝影多模态大模型的理解和推理能力排名第一,以此为基础,「家庭新成员」能全面感知用户的语音、表情、手势、以及环境数据,并进行深度理解和推理思考,具备理解世界、理解人类的能力。
如果要让汽车与用户心有灵犀,它还必须有拥有「记忆」,因为记忆是人类认知的核心,也是情感联结的基础。为此,商汤绝影打造了国内首个「车载类人记忆框架」,让系统实现类人的记忆能力。
商汤绝影的记忆框架与人类的记忆机制非常相似。它有临时记忆,能记得一些瞬时信息,比如车里的物品、人的搭配、有没有系安全带等;也有长期记忆,就像是一个「档案库」,存储用户的基本信息、行为模式和偏好等,它可以自我迭代,能从用户长期使用中总结规律并不断优化。而通过场景记忆,车机能针对当前场景进行毫秒级的动态记忆检索,提取关键信息,进行决策,主动服务。
合格的「家庭新成员」还要无时不在时刻准备为你服务,绝影打造了能够持续推理的 Always-on 运行框架,将多模态感知到的信息与各种记忆相结合,依托端云协同架构,数据延迟控制在 1 毫秒以下,首包延时最快只需 60 毫秒,推理速度达 40 Tokens/秒,对数据进行高效处理和反馈,时刻感知需求,主动为用户服务。
在追求智能和情感化的同时,商汤绝影始终坚持将用户隐私与安全放在首位,通过全方位的隐私保护与数据安全体系,做到「数据跟人走」、「隐私数据不出车」、「不该说的不说」,确保系统在安全合规的前提下提供极致体验,为每一位用户打造专属的安全空间。
端到端量产在即,「开悟」全新升级,绝影构建「车云一体」智驾新范式
今年年初,城区无图 NOA 是智能驾驶领域的核心话题。之后,端到端智驾技术为行业带来了范式革新,逐渐取代模块化的规则,成为智驾技术的进化方向。从北京车展开始,商汤绝影等多家公司陆续发布端到端智驾方案,智驾正在迈向端到端时代。
在本届「绝影实力 AI DAY」上,商汤绝影全面展示了基于 J6E、J6M、Orin 等不同算力平台打造的全场景高阶智驾、端到端智驾等绝影量产智驾产品体系。商汤绝影的智驾量产交付也在稳步推进,基于 J6 平台的智驾方案预计 2025 年第二季度将量产交付,而量产端到端智驾方案则预计会在明年年底量产落地。
在推进量产的同时,行业也发现,研发范式从规则驱动转变为数据驱动,端到端智驾模型对于高质量数据的需求呈指数级的增长。
然而,受限于高阶智驾的量产规模、算力资源,目前大多数车企和智驾公司都面临相同的问题,即高质量驾驶数据的获取难度大、效率低、成本高。
商汤绝影探索出一条新的道路,通过实车采集和仿真生成「双轮驱动」的数据闭环,构建量产智驾产品体系和世界模型深度融合的「车云一体」智驾新范式。
商汤绝影「车云一体」新范式
在 2024「绝影实力 AI DAY」上,王晓刚表示:「智驾高端局的竞争不止是车端模型的比拼,端到端的决战,战场在云端。」为此,商汤绝影全新升级并发布行业标杆级别的世界模型——「开悟」世界模型。
世界模型最基础也是最核心的能力是生成高质量视频数据,高质量数据的关键在于「真实」。基于多模态大模型打造的绝影世界模型,能够理解真实世界的物理规则、交通规则,生成的视频数据也更加逼真。现场展示的「开悟」生成视频案例中,晴朗天气下,汽车、路灯都是有影子的,右转车辆会主动让行优先级更高的直行车辆。
在真实的基础上,「开悟」生成的场景视频,时间最长为 150 秒、分辨率可达 1080P、视角可以实现 11V,是行业首个同时完成上述指标的智驾世界模型。
基于行人车辆 3D 框和时空轨迹的信号输入,「开悟」生成的 11V 时空一致视频
根据公开数据,「开悟」生成效果的各项指标开源均达 SOTA,优于包括 GAIA-1、DriveDreamer 在内的国内外主流世界模型。此外,从 2023 年开始,在全球知名的自动驾驶仿真模拟任务竞赛 Waymo Sim Agents 的比拼中,「开悟」连续两年获得第一名,是当之无愧的行业标杆。
更重要的是,通过多模态大模型,「开悟」世界模型可以支持多样化的自动驾驶场景及 Corner case 的可控生成。目前商汤绝影基于 1024 类场景,能够泛化出更多的平行世界,打造了千万级的生成场景库,预计 2025 年对行业开放。
以绝影量产智驾方案和「开悟」世界模型为核心,实车采集的真实数据和云端生成的仿真数据在「车云一体」的新范式下进行闭环流转,使得端到端智驾系统的训练更加全面、高效,大幅缩短了研发周期,降低了成本,让用户能够更快享受到智能驾驶带来的便捷与安全。
携手奇瑞大卓、东风汽车开展深度战略合作,打造共生共创共享合作新模式
商汤绝影的技术和产品持续创新,商业化落地也全面开花,量产交付稳步推进。智驾方案已量产交付广汽埃安、一汽红旗等 3 家车企 6 款车型。第三方调研数据显示,商汤绝影在座舱视觉 AI 软件市场的份额连续五年蝉联第一。此外座舱 AI 大模型产品已上车小米 SU7、智己、LEVC L380 等车型。
值得关注的是,商汤绝影面向海外市场升级了座舱视觉 AI 产品矩阵,助力极氪 X 的 DMS 系统斩获 ENCAP 历史最高分,并在「绝影实力 AI DAY」首发 ENCAP2026 OOP 离位检测、身材检测功能。
如今,商汤绝影已与超 30 家国内外车企达成合作,覆盖 100 余款车型,预计至 2024 年底,量产交付累计将突破 350 万辆。
商汤绝影已展现出在技术研发、产品创新和商业化落地等各个领域的全面实力,成长为智能汽车领域的顶级 AI 战略合作伙伴。
如今,智能汽车站在潜力无限的新起点上,作为加速智能汽车驶入 AGI 时代的战略合作伙伴,商汤绝影正全力推动最前沿的 AI 技术与智能汽车产业的深度融合。
单打独斗难以在 AGI 时代脱颖而出,主机厂和 AI 公司必须以全新的方式进行深度战略合作才有可能形成行业竞争力。目前,商汤绝影已和大卓智能、东风汽车等合作伙伴签订战略合作协议,在高阶智驾量产、端到端量产、AI 云服务、AI 大模型等领域开展全方位的深度合作,加速自动驾驶的落地与进化。
共享强大算力集群与大模型能力、共建数据基础施设、共创智能汽车 AI 应用生态,这一全新合作模式是通往 AGI 未来的必由之路,商汤绝影是迈向 AGI 之路的最佳同行者。
商汤绝影愿意和车企合作伙伴共享算力丰沛的商汤大装置,行业领先的 20,000 P 算力将为合作伙伴提供强有力的基础设施保障;同时,绝影将开放性能全面的基础大模型能力,提升车企的 AI 实力。
在共享大算力和大模型的基础上,双方能够加速研发体系的对齐,共同建设以高效率世界模型和全流程数据闭环为核心的数据基础设施。未来,数据的数量、质量和利用率等都不再是问题和阻碍,在智能汽车与云端平台之间流动的数据,将成为加速大模型上车的高效燃料。
在基础设施、大模型能力和全栈数据闭环进行深度合作之后,双方才能进一步挖掘出 AGI 在智能驾驶和智能座舱领域的潜力,共同创造全新的智慧出行体验。