Skip to main content

ST-Net: Scattering Topology Network for Aircraft Classification in High-Resolution SAR Images

本文提出了一种名为 ST-Net 的新框架,用于在高分辨率 SAR 图像中进行飞机分类。该网络利用飞机散射特性,构建基于图的拓扑关系。

该方法包括以下几个核心步骤:

  1. 散射感知特征匹配 (SAFM)

    • 提取与转换:首先,从原始图像中提取散射关键点,并从特征图中获取相应的散射关键特征。然后,结合目标姿态角和分辨率等参数,将散射关键点的坐标转换到标准状态,公式如下: x~i=(xixcenter)×cos(π/180×θ)/η(yiycenter)×sin(π/180×θ)/η+xcenter/η\widetilde{x}_i = (x_i - x_{\text{center}}) \times \cos(\pi/180 \times \theta)/\eta - (y_i - y_{\text{center}}) \times \sin(\pi/180 \times \theta)/\eta + x_{\text{center}}/\eta y~i=(xixcenter)×sin(π/180×θ)/η+(yiycenter)×cos(π/180×θ)/η+ycenter/η\widetilde{y}_i = (x_i - x_{\text{center}}) \times \sin(\pi/180 \times \theta)/\eta + (y_i - y_{\text{center}}) \times \cos(\pi/180 \times \theta)/\eta + y_{\text{center}}/\eta 其中 (xi,yi)(x_i, y_i) 是第 ii 个散射关键点,(xcenter,ycenter)(x_{\text{center}}, y_{\text{center}}) 是图像中心坐标,θ\theta 是目标姿态角,η\eta 是分辨率。
    • 分组与匹配:设计了一种新的散射分组算法,根据坐标位置将散射关键点分为不同的簇中心,并在线更新散射模板,以突出不同类别之间的差异。该算法的目标是找到每个类别 mm 的分组 CmC_m,最小化以下目标函数: L=m=1Mi=1NρCmiρψmi22L = \sum_{m=1}^{M} \sum_{i=1}^{N} \sum_{\rho \in C_{mi}} ||\rho - \psi_{mi}||_2^2 其中 MM 是类别数,ψmi\psi_{mi} 表示第 mm 类的第 ii 个散射分组组件信息,ρ=(x~,y~)\rho = (\widetilde{x}, \widetilde{y}) 表示转换后的坐标。使用余弦相似度计算测试图像的散射特征 F^s\hat{F}_s 与各类散射中心特征 ZsZ_s 之间的相似度得分,用于最终分类。
  2. 散射拓扑模块 (STM)

    • 图构建:将离散的散射关键点定义为拓扑节点 V={v1,v2,...,vN}V = \{v_1, v_2, ..., v_N\},节点之间的空间关系定义为拓扑边 eijE,i,j{1,...,N}e_{ij} \in E, \forall i, j \in \{1, ..., N\},其中 eij=1e_{ij} = 1。利用图 G={V,E}G = \{V, E\} 对输入散射关键特征 FsF_s 的空间关系进行建模。使用极坐标函数 γ(i,j)\gamma(i, j) 反映节点 ii 和节点 jj 之间的空间连接: γ(i,j)=(ρij,φij)\gamma(i, j) = (\rho_{ij}, \varphi_{ij}) ρij=(y~jy~i)2+(x~jx~i)2\rho_{ij} = \sqrt{(\widetilde{y}_j - \widetilde{y}_i)^2 + (\widetilde{x}_j - \widetilde{x}_i)^2} φij=arctan(y~jy~ix~jx~i)\varphi_{ij} = \arctan\left(\frac{\widetilde{y}_j - \widetilde{y}_i}{\widetilde{x}_j - \widetilde{x}_i}\right) 使用 KK 个高斯核作为加权算子,其中可学习的均值向量 μk\mu_k 和协方差矩阵 Σk\Sigma_k 计算如下: wk(γ(i,j))=exp(12(γ(i,j)μk)TΣk1(γ(i,j)μk))w_k(\gamma(i, j)) = \exp\left(-\frac{1}{2}(\gamma(i, j) - \mu_k)^T \Sigma_k^{-1} (\gamma(i, j) - \mu_k)\right) 高斯核 wk()w_k(\cdot) 表示散射关键点的空间信息,是加权邻接矩阵 AA 的条目值。
    • 图聚合:使用图卷积传播并更新邻居节点特征。给定散射特征输入 vjVv_j \in V 和高斯权重 wk(γ(i,j))w_k(\gamma(i, j)),节点 ii 的表示通过其邻域聚合: z^k(i)=jNeighbor(i)wk(γ(i,j))vjeij\hat{z}_k(i) = \sum_{j \in \text{Neighbor}(i)} w_k(\gamma(i, j)) v_j e_{ij} 其中 z^k(i)\hat{z}_k(i) 是邻居特征的加权融合。获得 KK 个特征后,执行特征融合得到 z^i=k=1Kz^k(i)\hat{z}_i = \sum_{k=1}^{K} \hat{z}_k(i)。特征 z^i\hat{z}_i 经过线性变换 LL 以获得转换后的特征 hi=L(z^i)h_i = L(\hat{z}_i)
    • 利用 Kullback-Leibler (KL) 散度减少类内拓扑的差异,KL 散度计算如下: DKL=KL(PQ)=p(x)logp(x)q(x)dxD_{KL} = KL(P||Q) = \int p(x) \log \frac{p(x)}{q(x)} dx
  3. 上下文注意力激励 (CAE)

    • 将整体特征图沿通道维度分成几个子特征,并行使用通道和空间注意力增强子特征。
    • 通道注意力分支:使用全局平均池化压缩空间维度,获得全局信息 a1a_1 a1=Fgp(Yk)=1W2×H2i=1W2j=1H2Yk(i,j)a_1 = F_{gp}(Y_k) = \frac{1}{W_2 \times H_2} \sum_{i=1}^{W_2} \sum_{j=1}^{H_2} Y_k(i, j) 通过 sigmoid 激活的门控机制计算校准信息: Yk1=σ(Fc(a1))Yk=σ(w1a1+b1)YkY_{k1} = \sigma(F_c(a_1)) \otimes Y_k = \sigma(w_1 a_1 + b_1) \otimes Y_k 其中 w1w_1b1b_1 是通道注意力分支中的缩放参数。
    • 空间注意力分支:使用组归一化 (GN) 获得初步的空间统计信息 a2=GN(Yk)a_2 = GN(Y_k),并应用 Fc()F_c(\cdot) 捕获远程依赖关系。加权输出计算如下: Yk2=σ(Fc(a2))Yk=σ(w2a2+b2)YkY_{k2} = \sigma(F_c(a_2)) \otimes Y_k = \sigma(w_2 a_2 + b_2) \otimes Y_k 其中 w2w_2b2b_2 是空间注意力分支中的缩放参数。
    • 连接两个分支中的特征图,并使用通道 shuffle 增强不同通道之间的通信,最后使用可变形卷积,公式如下: Y~(p0)=pnRw(pn)Y^(p0+pn+Δpn)\widetilde{Y}(p_0) = \sum_{p_n \in R} w(p_n) \cdot \hat{Y}(p_0 + p_n + \Delta p_n) 其中 pnp_n 是核偏移量。
  4. 目标函数

    • 总训练损失包含三个部分:SAFM 的匹配损失 LmatL_{mat},STM 的拓扑损失 LtopoL_{topo},以及 CAE 的分类损失 LclsL_{cls}。总损失函数如下: L=Lcls+λmatLmat+λtopoLtopoL = L_{cls} + \lambda_{mat} L_{mat} + \lambda_{topo} L_{topo} 其中 λmat\lambda_{mat}λtopo\lambda_{topo} 分别是 LmatL_{mat}LtopoL_{topo} 的正则化因子。

该论文构建了一个名为 SAR-ACD 的公共 SAR 飞机类别数据集,并在该数据集上进行了大量实验,结果表明 ST-Net 具有优越的分类性能。该数据集包含从高分三号卫星获取的 11 个 C 波段图像,涵盖上海虹桥机场区域和其他机场,包含六种民用飞机类别。