智加科技论文DualBEV入选计算机视觉顶会ECCV
近日,智加科技团队论文《DualBEV: Unifying Dual Veiw Tran**ormation with Probabilistic Correspondences》入选欧洲计算机视觉**会议(ECCV, European Conference on Computer Vision),ECCV是计算机视觉领域**影响力和权威性的**会议之一,与**计算机视觉大会(ICCV)和计算机视觉与模式识别会议(CVPR)齐名,被誉为计算机视觉领域的“三大顶会”之一。ECCV 每两年举办一次,汇聚了全球**的研究人员和专家,展示和讨论最前沿的研究成果和技术创新。
Bird's-Eye-View (BEV) 感知是当前自动驾驶感知乃至端到端技术的基石,其中视角转换 (View Tran**ormation) 则是 BEV 感知的核心模块,承担着将图像特征 (2D) 转换到 BEV 空间 (3D) 的重任。目前主流的方案往往会在 3D-to-2D 或 2D-to-3D 的视角转换方案间陷入两难。
3D-to-2D 方案一般依赖 Tran**ormer,在取得不错性能的同时也带来了大量的计算开销。2D-to-3D 虽然计算速度快,但是容易丢失卡车场景关心的远距离信息。
针对这些问题,DualBEV 从蒙特卡洛的概念出发,通过对 View Tran**ormation 本质的思考,把 View Tran**ormation 的过程总结为构建采样、计算权重,进而提出了一种通用的特征转换算法 (Unified Feature Tran**ormation)。该算法首先从两种方向上构建采样,通过三种概率测量的相乘对两种不同方向构建的采样统一进行评估,再通过预计算加速转换过程,融合得到**的 BEV 特征。
DualBEV 开创性地将 3D-to-2D 和 2D-to-3D 的视角转换方案统一进了一套整体框架内,充分利用各自视角的优势。在 nuScenes Detection Leaderboard 纯视觉方案上以 63.4% NDS 取得了 SOTA 的结果。由于视角转换模块使用了预计算技术,其计算时间仅为 Tran**ormer 方案的 1/40,是榜上**视角转换方法。
通过**的视角转换和多视角信息融合,DualBEV 构建的 BEV 特征提供了精准的场景表征和快速的计算方案,为端到端系统的开发提供了坚实的基础。智加科技正积极推进 DualBEV 在端到端自动驾驶系统中的深度集成,充分发挥其优势,进一步提升自动驾驶系统的整体性能。
技术赋能产品,开源合作共赢
DualBEV 进一步优化后的相关技术已应用于智加科技自主研发的前装量产重卡自动驾驶系统智加** 2.0 中。该系统开放了**自动驾驶功能,具备极致安全、舒适省力、节能环保等优势,可实现自主超车、靠边停车、汇入预测以及部分施工规避等**功能,支持在典型快递快运场景中“双驾变单驾”以显著**驾驶疲劳度,并通过**节油 10% 实现节能减排。
目前装配智加** 2.0 系统的智能重卡 K7 ,已被**邮政、中通快运、安能物流等头部物流公司投入实际运营,覆盖京津冀、长三角、珠三角等核心经济区,持续赋能干线物流行业数智化转型。
此次论文成功入选 ECCV 并进行部分研究成果开源,不仅展示了智加科技在自动驾驶领域的科研及创新能力,也将助力行业标准化和互操作性的提升。智加科技希望通过创新、合作与共享,集中力量攻克关键技术难题,有效推动自动驾驶技术的迭代与突破,**实现物流运输行业“智能、安全、环保”的高质量发展。