地平线余凯:99% 的人类司机驾驶行为不值得学习

摘要

20% 车企自研与 80% 第三方合作将成智驾赛道终局

4 月 18 日,以「征程所向,远超想象」为主题的 2025 地平线年度产品发布会举行。地平线重磅推出 L2 城区辅助驾驶系统——地平线 HSD,构建体验「类人」、用户「信任」的城区辅助驾驶新解。同时,地平线与奇瑞达成 HSD 首个量产合作,以全栈实力助力智能化量产迈向新征程。

在会后的深度访谈中,地平线创始人兼 CEO 余凯博士,分享了他对于智能驾驶、机器人以及人工智能未来发展的系统性思考。

本次访谈,不仅是对地平线过去十年探索的回顾,也描绘了他们对未来战略方向的判断。余凯博士坦诚地描绘了地平线的雄心:「3 - 5 年内地平线要把智能驾驶方向打爆掉,5 - 10 年希望把机器人业务给打爆掉。」这不是空泛的口号,而是基于对市场潜力的判断——他预计,仅智能驾驶业务,在未来三五年内便有望达到「至少几十亿美金」的市场规模。这份自信背后,是对产品力的极致追求和对用户价值的深刻理解。地平线的目标,是要「打造让用户尖叫的产品」,在竞争激烈的智驾领域,以近乎苛刻的标准「倒逼自己,做出 10 倍的产品力」。

如何定义「好」的智能驾驶?余凯博士认为,技术参数并非唯一标尺,「对于老百姓来讲智能驾驶最关注是不是足够舒适,是不是足够安全,是不是足够高效。」他将用户体验归结为「安全度、舒适度、专业度」三大核心指标,并坚信「用户口碑会说明一切」。这种思路,也贯穿于地平线的产品设计与技术迭代之中。

在通往更高阶智能驾驶的路径上,数据与算法扮演着至关重要的角色。然而,余凯博士提出了一个引人深思的观点:「99% 的司机行为是不值得学习的」。他认为,在人工智能致力于超越人类能力的当下,盲目依赖海量的普通用户驾驶数据并非最优解。相反,高质量的、经过专业训练的数据,以及更为重要的「仿真世界」,可能是「逼近世界真相」的关键。这暗示着,未来的自动驾驶顶级玩家,其核心竞争力或许将更多地体现在构建高效、逼真的仿真环境以及运用强化学习等先进训练方法的能力上,而非仅仅是数据的规模。

面对行业巨头如英伟达及其强大的 CUDA 生态,地平线展现出清晰的战略定力。余凯博士阐述了「窄门切入」的差异化竞争策略:不与巨头在通用计算领域全面抗衡,而是「聚焦智驾驾驶和机器人领域」,开发「相对聚焦领域的算子」,并构建属于自己的软硬件生态。他意识到,在人工智能时代,「懂软件的芯片公司很关键」,单纯的硬件供应商难以行稳致远。因此,地平线坚持「软硬结合」的技术路线,认为这是在智能驾驶领域实现最高「成本效率」的方式,并前瞻性地提出,未来的整车操作系统,很可能将是以 AI 为核心的全新形态。

谈及产业格局的终局,余凯博士给出了他的判断:「20% 车企自研与 80% 第三方合作将成为智驾赛道的稳态与终局。」他对车企自研芯片的雄心表示理解与支持,同时也对地平线在开放合作的市场中保持自身竞争力充满信心。他强调,尽管行业对「高阶自动驾驶」的宣传趋于理性,但「人类世界走向 L5 级自动驾驶的趋势不会发生任何改变」,地平线将持续贯彻「以高打低,以快打慢」的策略。同时,他积极看待当前行业规范化的进程,认为「规范对行业是好事,有规范,有轨道,整个智能驾驶技术列车才能真正快速发展。」

通过这次访谈,我们得以一窥地平线如何在时代的洪流中,以少有的战略定力与技术信仰,在快速变化的技术路线和市场中前行。这不是一家公司的故事,也是理解辅助驾驶产业发展过去和未来脉络的切口,值得仔细地思考。

以下为余凯访谈内容(部分节选)

99% 的人类司机驾驶行为不值得学习

媒体:地平线 HSD 有双 J6M、双 J6P 和单 J6P 三个硬件版本,想问这三个版本的时间节奏以及为何设置三个版本?

余凯:如果只站在我个人角度,我个人肯定希望只卖双 J6P,但每个车厂对产品的理解和定位不同。我认为行业趋势是向高算力发展,城区辅助驾驶会成为标配,我认为行业趋势是向高算力发展,城区辅助驾驶会成为标配,预计三年内会在 10 万级别的车型上普及。单 J6P 和双 J6P 性能更强,双 J6M 有成本优势。人工智能系统中,参数越多、模型越大效果越好,用户最终会选择大算力产品。就像基带发展,3G 时代只有高端机使用,到 4G 时低端机也普及了。我认为未来 2 - 3 年自动驾驶会迎来 4G Moment,只要城区辅助驾驶足够好。

媒体:发布会上提到地平线和蔚来萤火虫合作是基于 J5,而不是最新的 J6 产品。地平线和蔚来最早什么时候开始接触合作的?

余凯:应该不止一年了,2023 年我们开展合作并对外公布过。当时定点是 J5,因为当时 J6 还没出来。

媒体:今年有几家公司推出可插换芯片系统,华为建了 2000 多平米的工厂,大疆也有类似系统。但可插拔芯片面临组装无法满足车规级的问题。比如地平线如果跟奇瑞合作,是奇瑞建工厂来做吗?

余凯:那肯定的。

媒体:要是和吉利等其他公司合作,也需要建可插拔工厂吗?地平线服务多家车企,是否有其他方案?

余凯:是否专门建工厂还不确定,车企现有产线或许可以利用。

媒体:这种可插拔芯片模式会成为行业主流吗?

余凯:这是新出现的情况,很难说是否会成为模式。但从用户价值看,很有必要。未来 10 年自动驾驶变化大,每三年换辆车成本高,但换一台车载计算机更可行,对用户有价值,不过未来还需摸索。

媒体:发布会上提到英伟达的 CUDA,英伟达凭借大规模算子和丰富工具链,让 CUDA 生态占据垄断地位。开发者迁移时可能要重新写代码、优化算法。地平线怎么帮助主机厂和开发者解决迁移难题?

余凯:在服务器或数据中心的人工智能计算领域,很难赶上 CUDA 生态,目前没有公司能做到。英伟达面向的应用场景太广泛,需求多样,其它公司很难跟上。地平线的战略是在没有竞争的地方竞争,聚焦智能驾驶和机器人领域,这两个领域应用相对聚焦,算子也相对聚焦。我们从窄门切入,就像当年英伟达从图形计算切入,避开英特尔的通用计算,说不定在自动驾驶和机器人领域能开拓出大市场。

媒体:在 AI 模型发展过程中,数据很重要。现在有种说法是 99% 的人类数据不值得学习,在智能驾驶领域,如果人类数据不值得学习,是不是意味着数据不重要,或者需要找新的数据解决办法?地平线在这方面是怎么考虑的?

余凯:在大模型发展中,学习历史资料文献很重要,但用户行为数据不重要。在智能驾驶领域也是同样道理,99% 的司机驾驶行为,像刹车、拐弯、换道等,体验并不好。据我了解,特斯拉有自己专有的车队,专门训练司机提供训练数据,不是从普通用户获取数据,并且还通过强化学习在仿真平台训练。

媒体:您认为这种情况未来会成为行业主流吗?

余凯:与其花大力气筛选数据,不如只用黄金数据训练。特斯拉用专门车队训练司机获取数据,同时结合虚拟世界仿真。我还提出一些反共识观点,不是追求绝对正确,只是不想行业观点千篇一律,大家多思考、碰撞才能找到正确方向。现在智能驾驶领域的顶级玩家已经不依赖司机数据学习了。

媒体:以前行业主流认为车企或有数据、场景优势的企业在自动驾驶领域有优势,但技术范式转变后,以自动驾驶为终极目标的 L4 公司反而更有优势了?

余凯:那些 L4 公司整个系统成本太高,产品出发点和我们面向乘用车消费者的不一样,导致路径不同。

媒体:地平线在数据方面是怎么做的?

余凯:我们的看法和特斯拉类似。人工智能产品的目标是超越人类水平,和抖音了解用户喜好、逼近用户水平的逻辑不同。

媒体:用仿真虚拟平台生成数据,在数据规模和质量方面技术能达到什么程度?

余凯:仿真平台生成的数据更干净、高效,就像 Alpha Zero 在仿真平台左右互搏,棋艺远超人类,下棋方法也是人类历史上没有的。

媒体:围绕 AI 还有算力的问题。从 L2 到 L5 级别,算力提升很快。现在 AI 领域讨论大模型发展放缓,随着算力和数据达到一定规模,边际效应会越来越低。自动驾驶随着算力提升,目前是否还未出现这种情况?未来算力发展会不会也出现边际效应越来越低的情况?

余凯:在智能驾驶领域,目前增加算力、扩大网络规模和参数规模,能明显提升效果。比如特斯拉 FSD 不同算力版本,体验差异很大。未来 10 年自动驾驶仍需持续提升算力,但到一定程度会放缓。

媒体:放缓会在 L5 实现之前还是之后?

余凯:我认为 L3 要实现全场景辅助驾驶,当全场景辅助驾驶做得足够好后,算力提升可能会放缓。之后还会有很多细节工作要做,就像移动通信基带,做好很难,苹果想自己做基带,追了高通近 10 年才快追上。自动驾驶要在各种工况、路况下做到完美很难,从 90 分提升到 100 分非常艰难。

媒体:您很早就提出地平线要做 AI 时代的 Wintel,这个 Wintel 到底指什么?对英伟达来说可能是芯片 + CUDA,对今天的地平线来说是芯片 + 智驾方案,对特斯拉来说是 FSD + 整车,在自动驾驶行业,AI 时代的 Wintel 是什么?

余凯:汽车可能是人类历史上第一个真正的 AI 应用领域,如果存在整车操作系统,应该是以 AI 为主的操作系统,它不仅管自动驾驶,还能管控车内所有设备。车载大脑就是全新的操作系统,肯定不是安卓,安卓在车上只是附属,不是核心。

媒体:地平线有三个实验室,其中包括具身智能,发表的论文影响力很好。去年和很多做算法的人讨论过 Vision Mamba 方向,大家说它在脱离 Transformer 后对算力要求很高,表现也不够好。我想了解您怎么看 Vision Mamba 方向在学术上以及未来工程落地生态的可能性?

余凯:最近大家的研究方向是把 Vision Mamba 和 Transformer 结合,这样计算复杂度更好,效果也更好,腾讯也发表了相关论文。关于是否会成为未来主要方向,值得探索。Transformer 计算量确实太大,如果不解决这个问题,对 L4 发展限制很大。

媒体:发布会上提到「以高打低、以快打慢」,现在高阶不能提了,您觉得这对智能化战局有什么变化和影响?

余凯:「以高打低、以快打慢」的策略不变。人类走向 L5 级智能驾驶的趋势不会改变,现在没到 L3 就还是辅助驾驶。相关规范对行业是好事,之前行业竞争焦虑导致大家动作变形,回归正常轨道能让行业发展更快,就像高铁有轨道才能高速行驶,规范能让智能驾驶技术更好发展。

20% 车企自研与 80% 第三方合作将成智驾赛道终局

媒体:回顾地平线 10 年,地平线使命愿景有三个节点的变更。从 2015 年、2020 年到 2025 年,使命在缩小,一开始是赋能万物、赋能机器,接着是赋能智能汽车和机器人;愿景方面,一开始是芯片,然后是地平线的智能机房方案,再到智能产品。我想知道您怎么看地平线短期、长期 5 - 10 年的业务变化?

余凯:我觉得 3 - 5 年内,地平线要把智能驾驶方向做起来,机器人业务现在发展还为时尚早,起码还需要 5 年培育期。现在的机器人,比如扫地机太简单,人形机器人离真正实用还比较远,所以希望 5 - 10 年把机器人业务做起来。

媒体:市场规模能做到多大?

余凯:地平线 3 - 5 年内汽车业务市场规模至少做到几十亿美金。

媒体:机器人业务 5 年培育期后会发展到什么阶段?

余凯:可能出现拐点,比如让人形机器人在很多应用场景里真正发挥作用。

媒体:用户端区分不清晰,计算机行业可以根据配置、性能选择产品,但汽车时代用户不知道怎么选,不清楚什么是更好、更值得选的。

余凯:以前是这样,现在情况在改变。以前高速辅助驾驶让用户触达智能驾驶场景的机会很少。去 4S 店体验智能驾驶,店员说要开 40 分钟到高速,很多人就放弃了,所以智能驾驶对老百姓来说只是卖车时的一个配置说明,无法真正体验。但城区辅助驾驶出现后就不一样了,在 4S 店门口或日常通勤就能体验,好不好立马能感受出来。以前汽车配置像天窗,有或没有对消费者影响不大,现在城区辅助驾驶成为撬动市场的拐点,老百姓会关注它好不好。

媒体:有没有简单的区分方法?之前有说法是按算力区分。

余凯:简单分为城区辅助驾驶和高速辅助驾驶,关键还是要看好不好。从技术角度,算力越大,模型复杂度越高,用户体验越好,但老百姓更关注是否舒适、安全、高效。

媒体:现在头部车企都喜欢自研芯片,当像蔚来、小鹏等客户开始自研芯片时,地平线的策略是什么?是部分车型合作还是其他方式?

余凯:这些车企老大都是我的好朋友,他们要自研芯片,我都会支持。他们有很大梦想才会选择创业,希望成为乔布斯、马斯克那样的人,这值得鼓励。从产业终局看,虽然有 20% 的企业可能成功自研芯片,但 80% 还是会回到产业协同、协作。PC 产业就是例子,早年垂直自研芯片的 PC 厂家大多倒闭了。我相信市场会有地平线的生存空间,我们要做好自己的工作。

媒体:之前提到 20% 可能自研,80% 还是用第三方芯片,手机行业是这样,汽车行业最终也会这样吗?

余凯:手机行业是这样,但汽车行业最终情况还不确定,不过大部分还是会开放合作。

媒体:在 HSD 和竞品对比时提到单位成本性能最优,竞品是哪些?和特斯拉 FSD、华为 ADS 相比,地平线技术有哪些优势和劣势?

余凯:FSD 目前在量产车自动驾驶水平方面应该是世界最高的,华为的技术也很厉害,地平线的技术同样出色。这个比较很难做到客观,最终还是用户体验的问题。用户体验主要看三个指标:安全度、舒适度、专业度。用户口碑会说明一切。

媒体:大家之前认为地平线是芯片公司,现在逐步推出软硬结合方案,这是不是身份转变,从类似 Tier2(二级供应商)向 Tier1(一级供应商)转变?这种转变对未来和车企的合作模式有什么影响或新进展?

余凯:地平线的商业本质一直没变,过去几年给主机厂提供的不仅有芯片,还有大量软件工具链和开发工具,这也是地平线在自动驾驶芯片公司中脱颖而出的原因。芯片要部署软件,必须帮助车企快速部署。懂软件的芯片公司很关键,没有软件生态的芯片公司发展艰难。从商业模式看,我们还是二级供应商,很多一级供应商和我们交流密切,分工很清晰。地平线交付了 200 多万辆车,大多通过合作伙伴完成。我们要把精力放在核心技术和平台级研发上,和一级供应商合作,让他们负责车型适配和交付,地平线专注于提升芯片和 HSD 技术,推动城区辅助驾驶、L3、L4、L5 的发展。

媒体:奇瑞的合作也是这样吗?

余凯:肯定是,我们要尊重产业规律,和合作伙伴共赢。

智能驾驶要追求 10 倍产品力,打造「让用户尖叫」的产品

媒体:很多公司都在通过仿真做自动驾驶,小鹏宣布自研基座模型,训练超大参数模型并蒸馏部署到车端。地平线在强化学习和算力方面是怎么做的?另外,发布会上提到这一代方案是端到端和双系统,行业内有人认为 VLA 上一代技术是双系统,世界模型是 VLA 的下一代技术,地平线现在两种都在做吗?是量产一套、预研一套,还是其他技术架构?

余凯:我们认为真正的强化学习博弈才是系统 2,而不是把大语音模型加进去就是系统。大语音模型能提升车智能驾驶的认知能力,但不是真正的交互式博弈。所以我们把系统 2 精力主要放在强化学习上。

媒体:世界模型方面有什么布局?

余凯:我们一直在做世界模型,像 HMI 能生成美轮美奂的界面,把传感器数据生成周边动静态模型,就是基于世界模型实现的。

媒体:长期技术架构是双系统吗?

余凯:长期技术架构是双系统,强化学习的交互式博弈会不断反过来增强系统。司机开车时,老司机很多操作变成习惯,类似系统 1,系统 2 很多功能熟练后也会变成系统 1,但长期来看两个架构都会存在。我们部署了 7 万张卡,在算力方面投入很大。

媒体:看了 HSD 相关视频,拟人度够但激进度不够,比如前方车距拉得远,拐弯时也有问题。未来会推出更激进的版本吗?

余凯:我们不认为自动驾驶要激进,发布会上讲了信任模型,要让用户舒心、安心、放心。

媒体:弹夹系统在一定程度上可理解为后装。很多后装项目商业闭环不好做。

余凯:这个很难真正实现后装,车辆还是要返回产线处理,虽然某种意义上类似后装,但实际还是前装。

媒体:这能加深地平线和车企的绑定,形成生态护城河吗?

余凯:车企选择地平线技术路线后,后续升级也用我们的技术,从这个角度来说是的。

媒体:从 L2 到 L3 是关键时期,你也给出了路径和方案。目前行业对技术转变、技术路线和方案形成共识了吗?另外,地平线开始建设数据闭环,您前面提到做物理世界的大脑,是有这个想法吗?

余凯:地平线想做物理世界的计算平台。关于 L3,我在行业里算保守的,一直被行业推着走,对行业有敬畏之心。之前在百人会发言时,我就呼吁大家冷静,扎扎实实做好辅助驾驶。现在大家都说要实现 L3,我也只能跟着推进。

媒体:也就是说您觉得现在行业还没形成共识?

余凯:肯定没有,在技术快速变化的时代,很难形成共识。地平线的企业文化是踏实做事,地平线的「地」,从名字就体现了要接地气,打好基础,而不是盲目追求速度。

媒体:地平线目前的方案和特斯拉现有方案有什么不同?

余凯:最后其实区别不大,端到端强化学习、VLM、VLA 等,这些并不是关键区别,真正的区别在于苦活累活、经验积累、体系化的组织文化与能力。我们一直秉持稳健的态度,扎实做好工作。

媒体:地平线推出 HSD 到 Q3 量产,这个时间点和华为、Momenta 等厂商相比,您觉得晚吗?以奇瑞项目为例,要做标杆项目,如何定义标杆?有哪些标准?项目做到什么程度算成功?如果未来和其他车企合作有更多订单,是以出货量还是项目利润为衡量标准?

余凯:我只有一个标准,就是打造让用户尖叫的产品,其他都是结果,不是目标。目前市场上还没有因智驾而大卖的车,所以不用纠结早晚,关键是做出好产品。

媒体:但用户买车前是体验整车,智驾只是其中一部分。

余凯:没问题,我们只能倒逼自己,提升智驾产品力,做到 10 倍产品力,让其他营销等问题变得不那么重要。

媒体:您觉得这个时间点推出智驾晚吗?

余凯:当然不晚。

媒体:地平线在机器人「大脑」方面有什么突破规划或布局?

余凯:我们的逻辑是提供机器人时代的基础设施。目前机器人还没有突破性应用,需要长期培育生态。就像当年库克没看到苹果产品爆发式应用,但英伟达提前布局相关生态。我们希望地瓜计算芯片和平台成为所有机器人开发的首选,至于未来哪家企业能在机器人领域爆发很难预测,我们要做的就是做好「大脑」,也就是操作系统和芯片。

媒体:地平线聚焦自动驾驶和机器人业务,目前这两块业务的投入和产出情况如何?有多少人和资金分别投入在智能驾驶和机器人业务上?

余凯:资金投入方面很难给出具体数据,机器人业务投入大概占 1/20。今年机器人业务收入大概占 1/100,目前主要是招采招工、卖工具,处于机器人行业的「淘金时代」。

最新文章

极客公园

用极客视角,追踪你不可错过的科技圈.

极客之选

新鲜、有趣的硬件产品,第一时间为你呈现。

张鹏科技商业观察

聊科技,谈商业。