智加科技登顶自动驾驶 nuScenes 纯视觉 3D 目标跟踪榜单

近日，智加科技团队提出的 RockTrack 算法在国际权威的自动驾驶 nuScenes 算法挑战赛中，以 59.1% 的 AMOTA(多目标跟踪平均准确度) 超越所有纯视觉跟踪算法，登顶纯视觉 3D 目标跟踪榜单，刷新了榜单纪录。

NuScenes 数据集被认为是检验感知算法在自动驾驶领域相关任务性能的试金石。数据集包含了来自不同大洲、多种天气环境的 1000 多个场景和 140 万幅图像，标注了 23 类物体和 140 万个三维边界框。NuSceness 数据集在数据规模、数据维度、场景难度等多个维度上，已成为当前自动驾驶领域最为广泛使用、也是最权威的评测集。

3D 目标跟踪是常规 3D 目标检测的后继任务，旨在传感器数据的检测基础上，使得自动驾驶车辆具备长时间连续稳定跟踪车辆、行人等物体的能力，是对感知系统更完整和更综合的性能评测，也是自动驾驶领域要解决的核心问题之一。

参与 nuScenes3D 多目标跟踪任务的单位包括苏黎世联邦理工学院、斯坦福大学、麻省理工大学、清华大学、哈尔滨工业大学、香港科技大学、百度、丰田研究所、广汽研究院等国内外知名研究机构和企业。

纯视觉检测和跟踪任务相比有激光的系统而言，面临着测距、遮挡等多维度的更大挑战，智加科技通过在重卡视觉感知方向积累的研究和量产经验，创新性地提出了基于高度预测的 BEV 检测方法 BEVHeight，并针对纯视觉 BEV 检测存在的深度歧义、几何结构缺失的不足，设计了融合多维高级语义信息和多阶段关联的统一感知框架 RockTrack，以超越第二名 1% 的 AMOTA 指标问鼎跟踪榜单，验证了智加科技在纯视觉感知算法研究的领先性和所提算法的通用性。

视觉传感器和感知方法是当前可满足重卡对远距离目标、小目标等的测距测速需求的重要软硬件配置，智加科技长期致力于视觉主导感知算法的研究和量产应用，基于 BEV 框架提出的检测方法不仅具备跨场景的通用性，更结合重卡对感知的特殊性需求，创造性地提出了融合多基线立体视觉的 BEV 感知方案。相关技术成果已应用于智加科技自主研发的前装量产重卡自动驾驶系统智加领航 2.0 中。该系统开放了从收费站到收费站的领航自动驾驶功能，可实现极致的安全，支持在典型快递快运场景中「双驾变单驾」以显著降低驾驶疲劳度，并通过最高节油 10% 实现节能减排，赋能干线物流行业数智化转型。

来源：互联网

最新文章