(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210413353.9
(22)申请日 2022.04.20
(71)申请人 国网智能电网研究院有限公司
地址 102209 北京市昌平区未来科技城 滨
河大道18号
申请人 北京邮电大 学
国网江苏省电力有限公司信息通信
分公司
国家电网有限公司
(72)发明人 蒋静 冯方向 许梦晗 朱力鹏
周爱华 潘森 乔俊峰
(74)专利代理 机构 北京三聚阳光知识产权代理
有限公司 1 1250
专利代理师 林韵英(51)Int.Cl.
G06V 40/16(2022.01)
G06V 10/74(2022.01)
G06V 10/762(2022.01)
G06V 10/774(2022.01)
G06V 10/82(2022.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)
G06N 20/00(2019.01)
(54)发明名称
一种同义标签聚合方法、 装置、 设备及存储
介质
(57)摘要
本申请是关于一种同义标签聚合方法、 装
置、 设备及存储介质, 具体涉及计算机视觉技术
领域。 所述方法包括: 根据目标图像上的各个目
标标签, 获取各个目标标签分别对应的各个标签
向量; 以目标图像为样本, 以各个标签向量为标
注, 训练第一图像处理模型, 并将训练后的第一
图像处理模 型中的全 连接层参数, 划分为各个目
标标签分别对应的视觉特征向量; 基于目标标签
分别对应的视觉特征向量 以及目标标签分别对
应的标签向量, 对所述各个目标标签进行聚合处
理, 获得聚合后的各个同义标签集合。 上述方案
同时考虑到了目标标签的分布式表示 以及目标
标签在图像中含义, 从而提高了同义的目标标签
的聚合准确性。
权利要求书2页 说明书13页 附图3页
CN 114898426 A
2022.08.12
CN 114898426 A
1.一种同义标签聚合方法, 其特 征在于, 所述方法包括:
根据目标图像上的各个目标 标签, 获取 所述各个目标 标签分别对应的各个标签向量;
以所述目标图像为样本, 以所述各个标签向量为标注, 训练第一图像处理模型, 并将训
练后的第一图像处理模型中的全连接层参数, 划分为所述各个目标标签分别对应的视觉特
征向量;
基于所述目标标签分别对应的视觉特征向量以及所述目标标签分别对应的标签向量,
对所述各个目标 标签进行聚合处 理, 获得聚合后的各个同义标签集 合。
2.根据权利要求1所述的方法, 其特征在于, 所述根据目标图像上的各个目标标签, 获
取所述各个目标 标签分别对应的各个标签向量, 包括:
获取所述目标图像上的各个目标 标签;
通过词向量生成模型, 对所述各个目标标签进行处理, 获取所述各个目标标签分别对
应的各个标签向量。
3.根据权利要求1所述的方法, 其特征在于, 所述全连接层参数为以目标数量为第 一维
度、 以所述各个标签向量的数量 为第二维度的矩阵;
所述将训练后的第 一图像处理模型中的全连接层参数, 划分为所述各个目标标签分别
对应的视 觉特征向量, 包括:
将所述全连接层参数按照第二维度, 划分为长度为目标数量, 且分别与所述各个目标
标签对应的视 觉特征向量。
4.根据权利要求1所述的方法, 其特征在于, 所述以所述目标图像为样本, 以所述各个
标签向量 为标注, 训练第一图像处 理模型, 包括:
将所述目标图像通过第 一图像处理模型进行处理, 获得所述目标图像对应的各个预测
结果;
根据所述目标图像的各个预测结果, 与所述目标图像上的各个目标标签, 通过损 失函
数进行处 理, 获得目标图像的损失函数值;
根据所述目标图像的损失函数值, 对所述第一图像处理模型的参数进行反向传播更
新。
5.根据权利要求1至4任一所述的方法, 其特征在于, 所基于所述目标标签分别对应的
视觉特征向量以及所述目标标签分别对应的标签向量, 对所述各个目标标签进行聚合处
理, 获得聚合后的各个同义标签集 合, 包括:
针对任意两个目标标签, 计算所述两个目标标签的标签向量之间的第一标签向量距
离、 所述两个目标标签分别对应的视觉向量之 间的第一视觉向量距离以及所述两个目标标
签的标签向量之间的第一 正规化编辑距离;
将所述第一标签向量距离、 所述第 一视觉向量距离以及所述第 一正规化编 辑距离按照
目标权重加权求和, 获取 所述目标 标签之间的距离相似度;
根据所述目标标签之间的距离相似度, 将所述各个目标标签进行聚合处理, 获得聚合
后的各个同义标签集 合。
6.根据权利要求1至4任一所述的方法, 其特征在于, 所述基于所述目标标签分别对应
的视觉特征向量以及所述目标标签分别对应的标签向量, 对所述各个目标标签进 行聚合处
理, 获得聚合后的各个同义标签集 合, 包括:权 利 要 求 书 1/2 页
2
CN 114898426 A
2基于所述目标标签分别对应的视觉特征向量以及所述目标标签分别对应的标签向量,
对所述目标 标签执行第一聚合操作, 获得 各个第一类标签集 合;
在所述各个第 一类标签集合中选取标注标签集合; 所述标注标签集合中的第 一聚合标
签中存在含义标注; 所述含义标注用于区分不同语义的第一聚合标签;
以所述标注标签集合中的第一聚合标签为样本, 以及第一聚合标签的含义标注为标
注, 对目标回归 模型进行训练, 获得训练后的目标回归 模型;
根据所述训练后的目标回归模型, 计算所述各个目标标签之间的标签距离, 并根据所
述各个目标标签之 间的标签距离对所述各个目标标签进行第二聚合操作, 获得聚合后的各
个同义标签集 合。
7.根据权利要求6所述的方法, 其特征在于, 所述以所述标注标签集合中的第 一聚合标
签为样本, 以及第一聚合标签的含义标注为标注, 对目标回归 模型进行训练, 包括:
获取至少两个第 一聚合标签分别对应的标签向量的第 二标签向量距离、 所述至少两个
第一聚合标签分别对应的视觉特征向量之间的第二视觉 向量距离以及所述至少两个第一
聚合标签分别对应的标签向量之间的第二 正规化编辑距离;
将所述第二标签向量距离、 第二视觉向量距离以及所述第二正规化编辑距离, 根据所
述模型权重加权后通过激活函数处理, 获得所述至少两个第一聚合标签之间的距离函数
值;
根据所述距离函数值, 以及所述至少两个第一聚合标签的含义标注, 对所述目标回归
模型中的模型权 重进行更新。
8.一种同义标签聚合装置, 其特 征在于, 所述装置包括:
标签向量获取模块, 用于根据目标图像上的各个目标标签, 获取所述各个目标标签分
别对应的各个标签向量;
模型训练模块, 用于以所述目标图像为样本, 以所述各个标签向量为标注, 训练第一图
像处理模型, 并将训练后的第一图像处理模型中的全连接层参数, 划分为所述各个目标标
签分别对应的视 觉特征向量;
标签聚合模块, 用于基于所述目标标签分别对应的视觉特征向量以及所述目标标签分
别对应的标签向量, 对所述各个目标 标签进行聚合处 理, 获得聚合后的各个同义标签集 合。
9.一种计算机设备, 所述计算机设备中包含处理器和存储器, 所述存储器中存储有至
少一条指 令、 至少一段程序、 代码集或指 令集, 所述至少一条指 令、 至少一段程序、 代码集或
指令集由处 理器加载并执 行以实现如权利要求1至7任一所述的同义标签聚合方法。
10.一种计算机可读存储介质, 其特征在于, 所述存储介质中存储有至少一条指令, 所
述至少一条指令由处理器加载并执行以实现如权利要求1至7任一所述的同义标签聚合方
法。权 利 要 求 书 2/2 页
3
CN 114898426 A
3
专利 一种同义标签聚合方法、装置、设备及存储介质
文档预览
中文文档
19 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 14:30:50上传分享