基于HR-SDNet 的高分辨率 SAR 图像精确、稳定的船舶检测外文翻译资料

 2023-04-13 10:29:02

英语原文共 29 页,剩余内容已隐藏,支付完成后下载完整资料


基于 HR-SDNet 的高分辨率 SAR 图像精确、稳定的船舶检测

摘要:高分辨率合成孔径雷达(SAR)图像中的船舶检测是复杂环境下的一个具有挑战性的问题,特别是近岸和近海场景。目前,现有的SAR船舶探测方法主要采用分类网络获得的低分辨率表示,或从 SAR 图像中的低分辨率表示中恢复高分辨率表示。 由于表示学习的特点是分辨率低,分辨率损失巨大,难以在空间精度上获得准确的预测结果;因此,这些网络不适合于区域级的船舶检测。 本文提出了一种 基于高分辨率船舶检测网络(HR-SDNet)的高分辨率SAR图像船舶检测方法。 HR-SDNet 采用一种新的高分辨率特征金字塔网络(HRFPN),充分利用高分辨率和低分辨率卷积的特征映射来进行SAR图像舰船检测。 在该方案中,HRFPN并行连接高分辨率到低分辨率的子网,并能保持高分辨率。其次,采用Soft-NMS来提高NMS的性能,从而提高密集船舶的检测性能。然后,我们介绍了Microsoft Common Objectsin Context(COCO)评估度量,它不仅为更准确的包围盒回归提供了更高质量的评估度量平均精度(AP),而且还为中小型和大型目标提供了评估度量,从而精确地评估了我们的方法的检测性能。 最后,在SAR船探测数据集(SSDD)和 TerraSAR-X 高分辨率图像上的实验结果表明:(1) 我们基于 HRFPN 的方法对高分辨率 SAR 图像的近海和近岸场景具有优越的检测性能,达到近海与近岸场景中的特征金字塔网络(FPN)相比,性能增益为 3%,从而证明了其有效性;(2)与现有算法相比,我们的方法对高分辨率 SAR 图像,特别是近海和近岸场景的船舶检测更加准确和稳定;(3)采用 Soft-NMS 算法,我们的网络性能更好,在AP方面实现了近1%的性能增益;(4)COCO 评价指标对 SAR 图像船舶检测有效;(5)在一定范围内显示的阈值对船舶探测器的稳定性有显著影响。

1. 导言

高分辨率合成孔径雷达(SAR)图像由机载和星载 SAR 传感器提供,具有全天候、全天工作的能力。如今,这些SAR 图像已广泛应用于环境管理、国土资源管理、自然灾害预警、国防[1,2]等多个领域。 特别是,海上运输安全和渔业执法[3-5]等领域倾向于利用高分辨率 SAR 图像进行船舶检测,这是本文的主要课题。

SAR 图像中的船舶检测是一个复杂的问题,主要包含两个有待解决的问题。 一个是识别问题,其中探测器将船舶与背景分开,并设置准确的船舶类别标签。另一个是位置问题,为不同的船分配精确的边界框。然而,由于背景复杂,船舶难以准确检测,小型船舶容易被忽略,密集船舶难以区分,如图 1 所示。 因此,本文重点研究了一种高分辨率 SAR 图像近海和近岸场景的精确、稳定的船舶检测方法。

传统的船舶检测方法主要是基于海洋杂波[6–8]的统计分布的恒定误报率(CFAR),提取的特征是基于机器学习方法[9-12]。 然而,这些传统的方法高度依赖于人类预定义的特征分布[9,13-15],降低了新的SAR图像[9,15]的船舶检测性能。 因此,这些方法难以准确、稳定地进行船舶检测。 此外,还提出了许多基于超像素的船舶检测方法。 李等人[16]提出了一种改进的超像素级恒定误报率(CFAR)检测方法。 林等人 [17]提出了一种使用三种超像素级不同度量来自动检测船舶的方法。[18]提出了一个超像素级 Fisher 向量来描述目标和杂波之间的差异。 然而,这些方法也很难准确地检测船舶的近岸和近海场景。

近年来,深度学习理论发展迅速,使得研究人员从计算机视觉领域进行的目标检测有了新的突破。目前,深度学习被看作是未来的趋势,在目标检测中起着重要的作用,新兴算法大致可分为两类:(1)两阶段检测算法,首先生成过滤大部分负样本的区域建议,然后执行候选区域分类(一般需要细化具体的位置)。 这类算法的典型例子是基于区域方案的区域卷积神经网络(R-CNN)算法,如具有CNN特征 (R-CNN)[19]的区域、FastR-CNN[20]、Faster R-CNN[21]、特征金字塔网络(FPN)[22]、掩码 R-CNN[23]、 级联 R-CNN 等。 ⑵一阶段检测算法,取消区域提案阶段,通过获取对象的坐标值和类概率直接检测对象。典型的一级算法是(YOLOv1-v3)[25-27],Deconvolutional Single Shot Detector(SSD)[28],Deconvolutional Single Shot Detector (DSSD) [29],Feature Fusion Single Shot Multibox Detector (FSSD) [30],RetinaNet [31],等。 总之,两阶段算法比一阶段算法具有更高的精度,但一阶段算法训练更快、更简单。

目前,研究人员已经在 SAR 图像领域引入了船舶检测的深度学习方法。 刘等[32]应用基于陆海分割的光谱残差,实现了候选船舶位置的自动选择和卷积神经网络进行船舶识别。康等人。设计了一种基于上下文区域的多层融合 R-CNN,以提高检测小船舶的性能。 [34]提出了一种改进的具有 CFAR 的fast R-CNN 方法,为小船检测中的多尺度问题提供了一种解决方案。 李等人。 [35]将faster R-CNN 方法引入到船舶检测领域,并采用了特征融合等四种策略,同时建立了适合于证明新检测方法的船舶相关数据集。 王等人。 [36]采用单镜头多盒检测器,获得了较高的检测精度和相对较高的速度,并在过程中加入了转移学习,以减少假阳性。[37]采用 YOLOv2检测SAR图像中的船舶,减少了计算费用。 王等人,[3]针对多尺度问题,缓解了统计模型或提取特征的依赖性,利用RetinaNet获得了较高的船舶检测精度。 [38]提出了一种网格卷积神经网络来解决实时检测问题。 崔等人。提出了一个密集的注意金字塔网络,用于高分辨率SAR图像中的多尺度船舶检测。

然而,现有的 SAR 船舶检测方法主要是利用分类网络获得的低分辨率表示或从低分辨率表示中恢复高分辨率表示来进行SAR图像中的船舶检测。 因此,这些网络不适合于区域级的船舶检测,因为表示学习的特点是分辨率低,分辨率的巨大损失使得难以在空间精度上获得准确的预测结果。 特别是近海和近岸场景,结果更糟。本文提出了一种基于高分辨率船舶检测网络(HR-SDNet)的高分辨率 SAR 图像船舶检测方法。

首先,提出了一种新的高分辨率特征金字塔网络(HRFPN),以充分利用高分辨率和低分辨率卷积的特征映射来进行 SAR 图像舰船检测。HRFPN 并行连接高分辨率到低分辨率的子网,并能保持高分辨率。

接下来,使用区域提案网络(RPN)[21,22]生成候选船边界框提案。 此外,级联结构证明了它在目标检测[24,39,40]等各种任务上的有效性。 我们将使用级联结构对 SAR 图像船舶检测网络进行包围盒回归和分类,以提高船舶检测的质量。 此外,采(Soft-NMS)[41]来提高 NMS 的性能。它利用线性惩罚函数来降低所有其他邻居的检测分数,从而提高密集船舶的检测性能。

然后,我们在上下文中引入 Microsoft Common Objects(COCO)[42]评估度量,以精确地评估我们的方法的检测性能。 它不仅包括更高质量的评价指标平均精度(AP),以更准确的包围盒回归,而且还包括小、中、大目标的评价指标。 此外,我们还通过显示图像[43]的裁剪函数来分析图像预处理对检测器稳定性能的影响。

最后,很容易开发 HR-SDNet,并可用于端到端培训。 我们的结果表明,所提出的框架比 SSDD 数据集上现有的最先进的单模型船舶检测器获得了更好的性能[35],特别是使用了更高质量的评估度量。此外对新加坡海峡和直布罗陀海峡的Terra SAR-X[44]高分辨率图像的实验证明了我们的方法是有效和稳健的。总之这些结果验证了我们提出的方法在高分辨率SAR图像中的有效性和稳定性。

我们工作的主要贡献如下:

HRFPN 充分利用高分辨率和低分辨率卷积的特征映射来进行SAR图像舰船检测。 此外,HRFPN并行连接高分辨率到低分辨率的子网,并能保持高分辨率。 因此,与FPN相比,预测结果在空间上更加精确,

特别是近岸和近海场景。

  • 我们提出的框架 HR-SDNet 比现有的高分辨率 SAR 图像,特别是近岸和近海场景中的船舶检测算法更准确和健壮。
  • Soft-NMS 用于提高 NMS 的性能。 利用线性惩罚函数降低了所有相邻船舶的检测分数,从而提高了密集船舶的检测性能。
  • 我们引入COCO评价指标来精确评估我们的方法的检测性能,它不仅包含更高质量的评价指标AP,还包含针对小、中、大目标的评价指标。
  • 我们通过显示图像的裁剪函数来分析图像预处理对检测器稳定性能的影响。

本文的组织结构如下。第2节涉及到所建议的方法。第三节报告了实验结果,包括数据集和实验分析。第四节是讨论。第五节提出了一个概念和今后的工作。

2.方法

本节将详细阐述所提出的方法。

2.1 HR-SDNet的背景

视觉识别一般由三个主要的研究问题组成:图像级(图像分类)、区域级(目标检测)

和像素级(包括图像分割、人体姿态估计)。在最近的几年里,用于图像分类的卷

积神经网络已经成为解决视觉识别问题的标准结构,如 LeNet-5[45]、AlexNet[46]、

VGGNet[47]、GoogleNet、ResNet[49]、DenseNet等,如图 2 中的红色所示。 这种网

络的特征是表示学习在空间分解中逐渐变小。该网络不适用于区域级和像素级的视觉识别,因为表

示学习的特点是分辨率低,分辨率的巨大损失使得难以在空间精度上获得准确的预测结果。 因此,

为了补偿空间精度的损失,计算高分辨率有两条主线。一是从低分辨率表示中恢复高分辨率表示。

典型的结构包括Hourglass[51]、U-Net[52]、FPN[e2]等,如图 2 中的绿线所示。另一种是通过高分辨率卷积保持高分辨率表示,并增强具有并行低分辨率卷积的表示,例如高分辨率网络(HRNet)。虽然它具有良好的语义表达能力,但上采样本身不能完全补偿空间分辨率的损失。 因此,我们遵循维护的研究路线。图 2。表示学习的体系结构。红线路径表示低分辨率表示学习网络,黑线和绿线路径表示高分辨率表示恢复网络。高分辨率表示和进一步研究HRNet,在人体姿态估计[53]中取得了很有前途和显著的结果。HRNet始终通过网络的整个过程维护高分辨率特征映射,逐步增加低分辨率卷积,并联多分辨率卷积。同时,它通过在多分辨率表示之间不断交换信息,改进了高分辨率和低分辨率表示的表达式 ,允许在多分辨率表示之间实现更好的相互促进 。因此,不仅提高了高分辨率的表示,而且提高了空间精度。

2.2网络体系结构

如图 3 所示,高分辨率船舶检测网络(HR-SDNet)有四个组成部分:高分辨率特征金字塔网络(HR FPN) 作为构建多层次表示的骨干;区域目标网络(R PN)[21]生成候选对象 bindiiig 框提案;三级联快速RCNN,阈值 U={0.5,0.6,0.7}用于包围盒回归和分类;软 NMS[38]作为后处理步骤执行,以获得最终的船舶检测结果。 我们提出的船舶检测框架将在本节中详细介绍。

2.2.1主干网

由于 HRNet 最初是为人体姿态估计而设计的,因此不能直接应用于船舶检测。因此,对HRNet进行了改进,

以充分利用高分辨率和低分辨率卷积的特征图,用于SAR图像的船舶检测。所得到的网络被命名为高分辨

率特征金字塔网络(HRFPN),如图4所示

根据图4,HRFPN的体系结构包含四个阶段的卷积块,包括四个并行卷积流和一个HRFPN块。 第一阶段包括高分辨率的卷积。第二阶段、第三阶段和第四阶段分别重复双分辨率块、三分辨率块和四分辨率块。从一个茎开始,网络由两步步组成——2 3 times;3卷积,将分辨率降低到1/4[53,54]。 第一阶段包含与ResNet-50相同的四个残余单元[49,53,54],每个残余单元由一个宽度为64的瓶颈形成,然后是一个3times;3的卷积,从而减少了特征映射到CW的通道数量。 第二、第三、第四阶段分别由1、4、3个交换块组成。四种分辨率卷积的宽度(通道数)分别为CW,2CW4CW.and8CW[53,54]。卷积块的四个阶段的分辨率为1/4、1/8、1/16和1/32. 一个交换块由四个剩余单元[49,53,54]组成,每个剩余单元[49,53,54]包含两个3times;3卷积和每个分辨率中的一个跨分辨率交换单元。每次卷积后进行批归一化和非线性激活整正线性单元(ReLU)

图 5是三个分 辨 率输入和 四个分辨 率 输 出 的多分辨率表示信息交换。每个分辨率的输出表示可以合并三个分辨率的输入表示 ,以确保信息的充分利 用和交互。当 高分辨率降低到 低分辨率时,我们 使用 3times;3卷积 ,步 幅为 2。对于上采 样,采用 双 线 性 插 值,然后进行1times;1卷积 以匹 配信道数。此外,相 同分辨率的表示是以身份映射的形式。HRFPN中的其他多分辨率表示信息交换类似于图 5。

在我们的实验中,HRFPN由一个小网络、一个中间网络和一个大网络组成:HRFPN-W18、HRFPN-W32和HRFPN-W40,其中18、32和40分别代表后三个阶段高分辨率子网的宽度(Cw)。此外,在形成特征金字塔[53,54]之前,我们将HRFPN-W18、HRFPN-W32和HRFPN-W40的高分辨率表示的维数分别降低到144,256,320。因此,其他三个并行子网的Cw,HRFPN-W18为36、72,144,HRFPN-W32的为64、128,2

剩余内容已隐藏,支付完成后下载完整资料


资料编号:[589605],资料为PDF文档或Word文档,PDF文档可免费转换为Word

您需要先支付 30元 才能查看全部内容!立即支付

课题毕业论文、外文翻译、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。