不确定性编码增强的鲁棒自动驾驶多模态目标检测.docxVIP

不确定性编码增强的鲁棒自动驾驶多模态目标检测.docx

  1. 1、本文档共7页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

本文介绍了香港城市大学未来智慧交通实验室的ECAI2023录用论文Uncertainty-EncodedMulti-ModalFusionforRobustObjectDetectioninAutonomousDriving。该论文对多模态3D目标检测在各种极端场景下的不确定性进行了深入的量化和分析。根据评估结果,我们设计了一种名为UMoE的基于不确定性编码的混合专家融合模块。此模块显著提高了现有LiDAR与摄像头融合的3D目标检测模型在极端场景(如雪天、大雾、对抗攻击和光斑攻击)中的表现,并可轻松集成到任何融合后的3D目标检测模型中。

1

不确定性在极端场景下的指导意义

3D目标检测是自动驾驶感知的核心任务。近年来,基于LiDAR和摄像头的3D目标检测受到了广泛关注,因为它们为目标检测提供了互补的信息,如深度和视觉特征,从而实现了卓越的性能。但我们发现,许多融合策略并未充分考虑每个输入的质量,当某个传感器受到极端环境的影响时,整体的融合效果可能会受到严重影响。如图一所示,由于对抗攻击或浓雾,融合后的检测结果出现了误检(falsepositive)和漏检(missdetection)。

图一:摄像头、激光雷达、融合基线以及不确定性编码增强融合在晴朗、对抗攻击和恶劣天气这三种驾驶场景下的3D目标检测结果。

尽管不确定性已被广泛应用于描述单模态目标检测的性能,但在多模态融合中仍缺乏有效的策略。为了探索不确定性在LiDAR与摄像头融合中的潜在价值,我们对两种模态在正常和极端场景下的不确定性进行了详细的量化和分析。图二展示了在四种不同驾驶环境下,基于LiDAR和摄像头的检测模型的不确定性得分。

图二:四种驾驶场景下的平均不确定性得分。

从图一和图二的结果中,我们发现不确定性得分对于感知性能具有重要的指示作用

1.当传感器受到极端环境的影响时,检测结果的分类和回归的不确定性得分,尤其是对于误检,通常会上升。

2.在相同的驾驶场景中,误检产生的分类和回归不确定性得分远高于正确检测。

但我们也注意到,LiDAR和摄像头在不同的极端场景下对不确定性的敏感度不同,这为我们带来了一些挑战:

1.LiDAR和摄像头对环境变化的敏感性和认知能力有所不同,摄像头的不确定性得分比LiDAR更加波动。

2.LiDAR和摄像头的回归不确定性得分存在数量级的差异。

2

不确定性编码增强的混合专家融合模块

为了应对上述挑战,我们设计了一个名为“基于不确定性编码的混合专家融合模块”(UMoE)。此模块连接了激光雷达/摄像头3D目标检测器和后融合网络,通过考虑不同模态的不确定性来实现更鲁棒的融合效果。图三展示了集成UMoE模块的LiDAR-摄像头后融合架构。

图三:集成UMoE模块的LiDAR-摄像头后融合架构。虚线表示UMoE模块的数据流,实线表示后融合的数据流。

UMoE模块主要由两部分组成:

不确定性评分(Uncertainty?Scoring)

首先,我们利用基于LiDAR和摄像头的目标检测器处理传感器数据,生成检测框。结合MC-Dropout和DirectModeling两种方法,我们为每一个3D检测框计算并赋予一个不确定性得分和,这些得分将作为UMoE模块的关键输入。具体而言,对于置信度输出的不确定性得分,我们通过计算香农熵和置信度本身,来衡量其在truepositive检测框分布中的偏移程度。而对于框输出的不确定性得分u_reg,我们首先计算其totalvariance,然后与DirectModeling方法计算出的数据不确定性得分进行累加。

图四:置信度输出的不确定性标量分数

图五:框输出的不确定性标量分数

2.?基于混合专家架构的融合

为了克服由不确定性的不同敏感度和表征方式带来的挑战,我们引入了优化后的混合专家架构,以更有效地融合编码的不确定性得分。在此架构中,每一种传感器模态都配备了一个专门的专家网络(expertnetwork),该网络负责将检测框及其相应的不确定性得分映射到一个统一的特征空间,为后续的跨模态融合打下基础。随后,我们的门控网络(gatingnetwork)将所有模态的特征进行拼接,并预测出每个检测框在经过不确定性编码后的置信度得分。经过这一步骤,更新后的置信度得分将与检测框一同输入到后融合网络中,以实现更精确的目标检测。

3

实验与分析

为了验证UMoE模块的实际效果,我们选取了两种常用的后融合网络,并在以下四个不同数据集上进行了3D目标检测的平均精度评估:1)晴朗天气下的KITTI数据集;2)受到对抗攻击的KITTIAdv数据集;3)受到光斑攻击的KITTIBlind数据集;4)极端天气条件下的STF数据集。需要指出的是,KITTI和STF是公开的自动驾驶真实世界数据集,而KITTI

文档评论(0)

外卖人-小何 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档