
从世界模型到家庭新成员。
当前,全球汽车产业正以前所未有的速度向智能化、电动化转型,其中,辅助驾驶与智能座舱无疑是定义未来汽车核心竞争力的两大关键领域。在此背景下,人工智能技术的深度融合与创新应用,成为推动这一变革浪潮的根本驱动力。
作为最专注于汽车行业的 AI 公司,正以前瞻性的技术布局和产品理念,引领行业探索智能汽车的未来形态。
在上海车展前夕,商汤绝影 CEO、商汤科技联合创始人、首席科学家王晓刚博士接受了媒体的采访。他不仅对当前智能汽车技术的发展现状进行了深刻剖析,更基于商汤绝影的前沿研究和实践,描绘了下一代智能驾驶和智能座舱的发展蓝图。
智能驾驶:从数据驱动走向生成式智能驾驶
访谈刚开始,王晓刚博士就智能驾驶的未来发展路径提出了商汤的判断。他表示,自动驾驶经历了从基于物理模型和规则,到当前基于海量数据驱动的端到端模型的演进。
虽然端到端模型在模仿人类驾驶行为方面取得了进展,但也暴露了其固有的局限性:首先是对数据规模和质量的极度依赖,特别是高质量、高难度场景数据的稀缺性,多数人类驾驶数据在困难场景下表现不佳;其次是其不确定性,难以保证在特定问题场景下的确定性解决,且可能出现模型回退现象。
基于此,王晓刚博士提出智能驾驶正在迈向「生成式智能驾驶」新阶段。这一阶段的核心要素是「世界模型」(World Model)。世界模型能够高保真地重建并模拟泛化现实物理世界,在其中可以精确复现问题场景,并通过强化学习(Reinforcement Learning)进行反复训练,以确定性地解决这些问题。
更重要的是,世界模型能够基于现有场景生成海量、多样化的类似或极端场景数据,这极大地降低了真实世界数据采集的成本和风险。
商汤绝影发布的「开悟」世界模型,正是这一理念的关键技术支撑,并已在国际挑战赛中取得优异成绩。通过世界模型与强化学习结合,协同优化端到端模型,将是未来智能驾驶实现超越人类水平并提升安全确定性的新范式。这种云端研发比重日益加大的趋势,也凸显了高性能算力基础设施的重要性。
对于车端算力,王晓刚博士也表示,MOE 等架构的应用有助于在同等参数规模下降低算力需求,但算力上限依然决定了处理复杂场景的能力上限。
智能座舱:大模型的价值重塑
对于当下大火的deepseek,王晓刚博士表示,它的强大之处在于其深度思考和通过强化学习产生大量非人类知识的能力,打破了依赖海量互联网数据进行模仿学习所遇到的瓶颈,使得模型的表达更加生动有趣。
然而,他同时也表示,将通用大模型简单接入座舱并不适合,因为座舱场景需要的是「一句顶一万句」式的简洁、高效的交互,而非展示冗长的思维链推理过程。
这正是商汤绝影「新成员」(New Member)座舱产品理念的出发点——让车拥有「有趣的灵魂」,成为能够产生共情、融入家庭的多模态交互伙伴。
实现这一差异化体验,商汤绝影在技术层面进行了多项创新:首先,将 deepseek 等核心技术融入商汤自研的 SenseAuto-chat 模型,并结合多模态模型,使其具备针对座舱场景优化的深度思考和生动表达能力。
其次,构建了强大的记忆能力,通过向量映射等方式记录用户与座舱的点滴互动和生活经历,形成有深度的情感连接,而非简单的填表式信息记录。
第三,强调模型的「全时运行」(Always On)能力,使其能够在端侧持续感知、理解和记忆车内发生的一切,真正融入用户生活,而非仅在被唤醒时响应。
王晓刚博士强调,座舱是少数真实世界中存在多人多轮复杂对话的场景,而「新成员」通过深度思考,甚至能在其中识别人物关系、情绪,提供建议,化解矛盾,真正扮演家庭成员的角色。
为了支持这些创新体验,商汤绝影推出了行业首个车载 AI 内核「绝影千机」,并与主机厂合作构建 AI 操作系统(AI OS),该系统由主机厂的整车 OS、商汤的 AI 内核以及第三方智能体共同构成,旨在提供一个开放、强大的 AI 基础设施。
多维度的产业思考:数据、安全和未来
访谈中,王晓刚博士还就多个行业焦点问题分享了观点。对于数据价值的讨论,他表示「大部分人类驾驶数据价值有限」,再次强调了模拟仿真在获取高质量、多样化数据和验证安全边界上的不可替代性。商汤绝影的数据来源包括自有采集、量产车辆回流的问题场景数据,以及通过「开悟」世界模型生成的数据,并通过持续迭代提升生成数据的质量,使其满足量产需求。
在智能驾驶的安全责任争议方面,王晓刚博士认为,除了数据和世界模型带来的确定性提升,舱驾融合,特别是驾驶员监控系统(DMS)和 3D 视线追踪技术的应用,是保障安全的重要手段。通过精确掌握驾驶员的注意力状态,可以在智驾系统运行时进行必要的提醒或干预,大幅降低事故风险,并预计 DMS 在法规驱动下重要性和精度要求将大幅提升。
关于量产合作和出海战略,王晓刚博士透露了商汤绝影与广汽、奇瑞、东风、一汽等多家国内主流车企的合作进展,并表示正在积极跟随中国车企一同出海,同时持续与全球品牌和合资车企保持合作,认为海外市场尤其是在 ENCAP 等法规推动下,DMS/OMS 等领域有较大增长空间。
针对 AI 大模型对汽车产业的重构影响,王晓刚博士认为这种影响是全方位的,不限于汽车,包括研发流程(代码生成、测试)、生产制造(机器人应用)、运营管理(数据分析)等各个环节都将受益于 AI 的深入融合。
最后,关于「只做软件不赚钱」的观点,王晓刚博士表示商汤绝影的业务模式并非纯软件,而是「驾舱云三位一体」的 AI DC 云服务,结合模型工具链和云服务。同时,在座舱领域也存在软硬结合的机会,例如优化芯片对大模型的支持以及单摄像头实现 DOMS 功能等,业务模式将根据需求灵活设计。对于 L3 级自动驾驶,商汤绝影也在积极与车企合作探索,认为 L3 对系统冗余、人机协同(特别是接管环节)及舱驾融合提出了更高要求。