(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210623810.7
(22)申请日 2022.06.02
(71)申请人 中国科学院地理科 学与资源研究所
地址 100101 北京市朝阳区大屯路甲1 1号
(72)发明人 王勇 曾祥强
(74)专利代理 机构 北京高沃 律师事务所 1 1569
专利代理师 刘芳
(51)Int.Cl.
G06V 20/10(2022.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)
G06V 10/44(2022.01)
G06V 10/80(2022.01)
G06V 10/82(2022.01)
(54)发明名称
一种遥感影 像道路提取方法及系统
(57)摘要
本发明公开了一种遥感影像道路提取方法
及系统, 涉及图像处理领域, 所述方法, 包括: 获
取待解译的遥感影像; 将待解译的遥感影像输入
道路提取模 型中, 提取待解译的遥感影像的道路
信息; 道路提取模型的确定方法为: 构建SGF ‑Net
模型; 对SGF ‑Net模型进行训练得到初始提取模
型; 采用知识蒸馏策略对道路初始提取模型进行
压缩得到道路提取模型。 SGF ‑Net模型包括依次
连接的编码器、 全局信息感知网络和解码器; 编
码器与解码器连接; 编码器是基于空间注意力机
制构建的。 本发 明能快速准确的从遥感影像中提
取道路信息 。
权利要求书3页 说明书16页 附图8页
CN 114821342 A
2022.07.29
CN 114821342 A
1.一种遥感影 像道路提取 方法, 其特 征在于, 包括:
获取待解译的遥感影 像;
将所述待解译的遥感影像输入道路提取模型中, 提取所述待解译的遥感影像的道路信
息;
其中, 所述道路提取模型的确定方法为:
构建SGF‑Net模型; 所述SGF ‑Net模型包括依次连接 的编码器、 全局信息感知网络和解
码器; 所述编 码器与所述解码 器连接; 所述编 码器是基于空间注意力机制构建的; 所述编码
器用于提取输入遥感影像的浅层特征, 得到第一特征图; 所述全局信息感知 网络用于提取
所述第一特征图的深层特征, 得到第二特征图; 所述解码器用于将所述第一特征图中的浅
层特征与所述第二特征图中的深层特征进行解码并融合, 得到输入遥感影像的道路信息;
所述浅层特 征包括道路光谱信息和道路几何形状信息; 所述深层特 征包括道路语义信息;
采用遥感训练影像和对应的道路信息对所述SGF ‑Net模型进行训练, 并将训练好的
SGF‑Net模型确定为初始提取模型;
采用知识蒸馏策略对所述道路初始提取模型进行压缩得到所述道路提取模型。
2.根据权利要求1所述的一种遥感影像道路提取方法, 其特征在于, 所述编码器, 具体
包括: 多个依次连接的编码单 元;
所述编码单 元包括依次连接的编码块和空间注意力机制层;
所述编码块是基于ResNet ‑34网络构 建的; 所述编码块用于对输入的特征进行编码, 得
到编码特 征;
所述空间注意力 机制层包括依次连接的池化层和尺寸为7 ×7的第一卷积层; 所述池化
层用于对输入的所述编 码特征分别进 行最大池化和平均池化, 得到道路特征在空间维度的
分布信息; 所述第一卷积层用于根据所述分布信息确定道路特征 的空间分布关系, 并为每
个特征点分配权重, 得到空间注意力特征图; 所述空间注意力特征图与所述编码特征点乘
后, 再与所述编码特 征相加, 得到编码输出 特征;
其中, 所述编码器中第一个编码单元的编码块输入的特征为输入遥感影像; 所述编码
器的最后一个编码单 元的编码输出 特征为所述第一特 征图。
3.根据权利要求2所述的一种遥感影像道路提取方法, 其特征在于, 所述全局信 息感知
网络, 具体包括:
扩张卷积单 元和自注意力单 元;
所述扩张卷积单元包括五个扩 张率不同且依次连接的扩 张卷积层; 所述扩 张卷积单元
用于提取 所述编码器输出的所述第一特 征图中不同空间范围的特 征区域;
所述自注意力单元包括三个并联的卷积层; 所述自注意力单元用于对所述编码器输出
的所述第一特征图进行通道维度的压缩, 得到特征点之间的长距离关系; 不同空间范围的
特征区域和特 征点之间的长距离关系相加得到第二特 征图。
4.根据权利要求3所述的一种遥感影像道路提取方法, 其特征在于, 所述解码器, 具体
包括:
多个依次连接的解码单 元;
所述解码单元与所述编码单元跳跃连接; 所述解码单元包括依次连接的解码块和特征
融合模块; 所述特 征融合模块与所述编码器中对应的空间注意力机制层连接;权 利 要 求 书 1/3 页
2
CN 114821342 A
2所述解码块包括依次连接的尺寸为1 ×1的第二卷积层、 尺寸为3 ×3的转置卷积层和尺
寸为1×1的第三卷积层; 所述第二卷积层用于对输入的特征进行降维; 所述转置卷积层用
于扩大降维后的特征 的宽度和高度; 所述第三卷积层用于对所述扩大后的特征进行升维,
得到解码特征; 其中, 所述解码器中第一个解码单元 的解码块输入的特征为所述第二特征
图;
所述特征融合模块包括依次连接的融合层和宽度为5的一维卷积层; 所述融合层用于
将所述解码块输出 的解码特征与所述编码器输出 的第一特征图相加, 得到融合特征; 所述
一维卷积层用于根据所述融合特征学习浅层特征与深层特征之 间的互补信息, 得到通道注
意力图; 所述通道注意力图与所述第一特征图进行矩阵点乘, 所述通道注意力图与所述解
码特征行矩阵点乘, 两个矩阵点乘后的特征图相加, 得到编码输出特征; 所述解码 器中最后
一个解码单 元的特征融合模块的编码输出 特征为所述输入遥感影 像的道路信息 。
5.根据权利要求1所述的一种遥感影像道路提取方法, 其特征在于, 所述采用知识蒸馏
策略对所述道路初始提取模型进行压缩得到所述道路提取模型, 具体包括:
将所述道路初始提取模型作为教师网络;
采用所述教师网络建立学生网络;
将所述遥感训练影像分别输入所述教师网络和所述学生网络, 基于类别知识蒸馏和特
征知识蒸馏, 以知识蒸馏机制下 的损失值最小为 目标, 采用所述教师网络对所述学生网络
进行训练, 得到训练好的学生网络; 所述知识蒸馏机制下 的损失值包括类别知识蒸馏的损
失值、 特征知识蒸馏的损失值和模型训练损失值;
将所述训练好的学生网络确定为所述道路提取模型。
6.根据权利要求5所述的一种遥感影像道路提取方法, 其特征在于, 所述知识蒸馏机制
下的损失值的计算公式为:
Ltotal=LCE+0.1*LKL+0.05*LF;
Ltotal表示知识蒸馏机制下的损失值; LKL表示类别知识蒸馏的损失值; LF表示特征知识
蒸馏的损失值; LCE表示模型训练损失值。
7.根据权利要求6所述的一种遥感影像道路提取方法, 其特征在于, 所述类别知识蒸馏
的损失值的计算公式为:
其中, N表示像元个数; fKL(·)表示Kullback ‑Leibler散度计算; Ti表示教师网络对第i
个像元的类别识别结果; Si表示学生网络对第i个 像元的类别识别结果;
所述特征知识蒸馏的损失值的计算公式为:
其中, a表示编码器中编码块的索引; j表示特征图的通道索引; Ta,j表示教师网络中第a
个编码块输出的浅层特征中第j通道的特征图; Si,j表示学生网络中的第a个编码块输出的
浅层特征中第j通道的特 征图; ||·||2表示L2归一化;
所述模型训练损失值的计算公式为:权 利 要 求 书 2/3 页
3
CN 114821342 A
3
专利 一种遥感影像道路提取方法及系统
文档预览
中文文档
28 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共28页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-03-03 12:06:36上传分享