安全公司报告
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210330918.7 (22)申请日 2022.03.30 (71)申请人 国家电网有限公司大 数据中心 地址 100031 北京市西城区宣武门内大街8 号 (72)发明人 陈振宇 王路涛 李博 陈思宇  边靖宸 武丽莎 杨畅  (74)专利代理 机构 北京安博达知识产权代理有 限公司 1 1271 专利代理师 徐国文 (51)Int.Cl. G06V 10/762(2022.01) G06V 10/774(2022.01) G06V 10/74(2022.01) G06V 10/82(2022.01)G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 一种基于深度学习的影像相似度数据清洗 方法及系统 (57)摘要 本发明提供了一种基于深度学习的影像相 似度数据清洗方法及系统, 包括: 获取影像数据, 并对所述影像数据进行处理得到成对的影像数 据; 将所述成对的影像数据输入到预先训练好的 融合网络模 型中, 得到所述 成对的影像数据的相 似性度量值; 由所述成对的影像数据的相似性度 量值对所述影像数据进行聚类完成数据清洗; 其 中, 所述预先训练好的融合网络模 型是基于成对 的影像数据结合包含损失项和正则化项的学习 目标函数对双支卷积神经网络进行训练得到的。 本发明采用了融合网络结合损失函数的方法, 解 决了人力标注成本高, 效率低下, 容易产生重复 操作的问题, 实现了对相同场景下的类似部件进 行聚类, 提高了效率和准确率。 权利要求书2页 说明书8页 附图6页 CN 114863153 A 2022.08.05 CN 114863153 A 1.一种基于深度学习的影 像相似度数据清洗方法, 其特 征在于, 包括: 获取影像数据, 并对所述影 像数据进行处 理得到成对的影 像数据; 将所述成对的影像数据输入到预先训练好的融合网络模型中, 得到所述成对的影像数 据的相似性度量 值; 由所述成对的影 像数据的相似性度量 值对所述影 像数据进行聚类完成数据清洗; 其中, 所述预先训练好的融合网络模型是基于成对的影像数据 结合包含损失项和正则 化项的学习目标函数对双支卷积神经网络进行训练得到的。 2.如权利要求1所述的方法, 其特 征在于, 所述融合网络模型的训练包括: 获取影像数据; 对所述影 像数据进行处 理, 得到成对的影 像数据; 并对所述成对的影像数据按照相似度的大小划分正样本和负样本, 并分别对正样本和 负样本设置相似度量 值; 将所述正样本和所述负样本分别作为双支卷积神经网络的输入, 将所述正样本和所述 负样本对应的相似度量值分别作为双支卷积神经网络的输出, 以损失项和正则化项作为学 习目标函数, 对所述双支卷积神经网络的进行训练, 得到训练好的融合网络模型。 3.如权利要求1所述的方法, 其特征在于, 所述将所述成对的影像数据输入到预先训练 好的融合网络模型中, 得到所述成对的影 像数据的相似性度量 值包括: 将所述成对的影 像数据通过双支卷积神经网络从原 始空间映射到低维度目标空间; 基于所述低维度目标空间中的成对的影像数据结合所述学习目标函数得到所述成对 的影像数据的相似性度量 值。 4.如权利要求1所述的方法, 其特征在于, 所述由所述成对的影像数据的相似性度量值 对所述影 像数据进行聚类完成数据清洗包括: 若所述相似性度量值达到预先设定的值则对成对的影像数据进行聚类, 完成清洗, 否 则去除影 像数据。 5.如权利要求3所述的方法, 其特 征在于, 所述学习目标函数按下式计算: 式中, w为神经网络的权 重; 为第i个训练影 像的输出神经 元; yi为相应的标签。 6.一种基于深度学习的影 像相似度数据清洗系统, 其特 征在于, 包括: 获取模块, 用于获取影 像数据, 并对所述影 像数据进行处 理得到成对的影 像数据; 输入模块, 用于将所述成对的影像数据输入到预先训练好的融合网络模型中, 得到所 述成对的影 像数据的相似性度量 值; 聚类模块, 由所述成对的影像数据的相似性度量值对所述影像数据进行聚类完成数据 清洗; 其中, 所述预先训练好的融合网络模型是基于成对的影像数据 结合包含损失项和正则 化项的学习目标函数对双支卷积神经网络进行训练得到的。 7.如权利要求6所述的系统, 其特 征在于, 所述融合网络模型的训练包括: 获取影像数据;权 利 要 求 书 1/2 页 2 CN 114863153 A 2对所述影 像数据进行处 理, 得到成对的影 像数据; 并对所述成对的影像数据按照相似度的大小划分正样本和负样本, 并分别对正样本和 负样本设置相似度量 值; 将所述正样本和所述负样本分别作为双支卷积神经网络的输入, 将所述正样本和所述 负样本对应的相似度量值分别作为双支卷积神经网络的输出, 以损失项和正则化项作为学 习目标函数, 对所述双支卷积神经网络的进行训练, 得到训练好的融合网络模型。 8.如权利要求6所述的系统, 其特 征在于, 所述输入 模块具体用于: 将所述成对的影 像数据通过双支卷积神经网络从原 始空间映射到低维度目标空间; 基于所述低维度目标空间中的成对的影像数据结合所述学习目标函数得到所述成对 的影像数据的相似性度量 值。 9.如权利要求8所述的系统, 其特 征在于, 所述学习目标函数按下式计算: 式中, w为神经网络的权 重; 为第i个训练影 像的输出神经 元; yi为相应的标签。权 利 要 求 书 2/2 页 3 CN 114863153 A 3

.PDF文档 专利 一种基于深度学习的影像相似度数据清洗方法及系统

文档预览
中文文档 17 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于深度学习的影像相似度数据清洗方法及系统 第 1 页 专利 一种基于深度学习的影像相似度数据清洗方法及系统 第 2 页 专利 一种基于深度学习的影像相似度数据清洗方法及系统 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 14:32:18上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。