摘要:针对当前 3D 目标检测算法将不同模态数据融合时会产生错位现象,从而破坏数据之间的关联性并造成数据损失的问 题,提出了一种基于 Transformer 的融合信息增强 3D 目标检测算法。 首先设计了 Transformer 双域融合特征区域建议模块,利用 变形注意力机制,将提取到的雷达点云特征和图像特征进行双域特征融合,用于生成 3D 预选框;其次,通过设计的深度补全机 制的特征信息增强模块,补全密集的深度和特征语义信息来完成框的细化;最后,设计了多模态特征交叉注意力模块,采用动态 交叉注意力机制来获得不同模态间的相关性,从而将特征信息有效对齐融合。 在 Kitti、Nuscences 和 Waymo 数据集上的实验结 果证明了该算法的有效性和通用性。 大量的消融实验证明了该算法各个模块的有效性。 在实车平台上的实验结果表明,该算 法在复杂的实际环境中具有优秀的鲁棒性。