中国自然资源航空物探遥感中心主办
地质出版社出版

融合混合注意力机制与多尺度特征增强的高分影像建筑物提取

曲海成, 梁旭. 2024. 融合混合注意力机制与多尺度特征增强的高分影像建筑物提取. 自然资源遥感, 36(4): 107-116. doi: 10.6046/zrzyyg.2023146
引用本文: 曲海成, 梁旭. 2024. 融合混合注意力机制与多尺度特征增强的高分影像建筑物提取. 自然资源遥感, 36(4): 107-116. doi: 10.6046/zrzyyg.2023146
QU Haicheng, LIANG Xu. 2024. Building extraction from high-resolution images using a hybrid attention mechanism combined with multi-scale feature enhancement. Remote Sensing for Natural Resources, 36(4): 107-116. doi: 10.6046/zrzyyg.2023146
Citation: QU Haicheng, LIANG Xu. 2024. Building extraction from high-resolution images using a hybrid attention mechanism combined with multi-scale feature enhancement. Remote Sensing for Natural Resources, 36(4): 107-116. doi: 10.6046/zrzyyg.2023146

融合混合注意力机制与多尺度特征增强的高分影像建筑物提取

  • 基金项目:

    国家自然科学基金面上项目“面向数据特性保持的高光谱影像高效压缩方法研究”(42271409)

    辽宁省高等学校基本科研项目“基于脉冲混合神经网络的高效能目标检测”(LJKMZ20220699)

详细信息
    作者简介: 曲海成(1981-),男,博士,副教授,主要研究方向为遥感图像高性能计算、智能大数据处理等。Email: quhaicheng@lntu.edu.cn
    通讯作者: 梁旭(1998-),男,硕士研究生,主要研究方向为数字图像处理与模式识别。Email: 15047728650@163.com
  • 中图分类号: TP751

Building extraction from high-resolution images using a hybrid attention mechanism combined with multi-scale feature enhancement

More Information
    Corresponding author: LIANG Xu
  • 由于复杂背景变换和建筑物形状多样化等因素影响,从高分辨率遥感图像中准确提取建筑物信息面临着挑战。该文提出了一种融合混合注意力机制与多尺度特征增强的高分辨率建筑物语义分割网络(building mining net,BMNet)。首先,编码器部分使用VGG-16作为主干网络来提取特征,得到4层特征表示; 然后设计解码器用于解决多尺度信息中高层特征的细节信息丢失问题,引入了混合通道注意力和空间注意力的串联注意力机制(series attention module,SAM),增强高层特征的表示能力; 同时,设计了一种渐进式特征增强的建筑物信息挖掘模块(building mining module,BMM),进一步提高建筑物分割的准确性。BMM把上采样后的特征映射、经过SAM处理的特征映射以及初始预测结果作为输入,获取背景噪声信息,并利用所设计的上下文信息探索模块滤除背景信息,在经过多次BMM处理后得到最佳预测结果。对比实验结果表明: BMNet在武汉大学建筑数据集上精度和交并比分别优于U-net 4.6%和4.8%,在马萨诸塞州建筑数据集和Inria航空图像标注数据集上精度和交并比分别优于U-net 7.9%,8.9%和6.7%,11.0%,验证了所提模型的有效性以及实用性。
  • 加载中
  • 加载中
计量
  • 文章访问数:  44
  • PDF下载数:  49
  • 施引文献:  0
出版历程
收稿日期:  2023-05-23
修回日期:  2023-09-02
刊出日期:  2024-12-23

目录