专利 特征提取模型的训练方法、图像检索方法、装置及设备

(19)国家知识产权局 (12)发明专利 (10)授权公告号 (45)授权公告日 (21)申请号 202210330051.5 (22)申请日 2022.03.31 (65)同一申请的已公布的文献号申请公布号 CN 114417046 A (43)申请公布日 2022.04.29 (73)专利权人腾讯科技（深圳）有限公司地址 518057 广东省深圳市南山区高新区科技中一路腾讯大厦3 5层 (72)发明人郭卉　 (74)专利代理机构北京三高永信知识产权代理有限责任公司 1 1138 专利代理师李文静 (51)Int.Cl. G06F 16/583(2019.01) G06V 10/40(2022.01)G06V 10/74(2022.01) G06V 10/762(2022.01) G06V 10/774(2022.01) G06V 10/764(2022.01) G06V 10/82(2022.01) G06K 9/62(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) 审查员邹玥 (54)发明名称特征提取模型的训练方法、图像检索方法、装置及设备 (57)摘要本申请公开了一种特征提取模型的训练方法、图像检索方法、装置及设备，属于图像处理技术领域。方法包括：获取多个样本图像对和多个样本图像对中各张样本图像的标注类别；根据神经网络模型获取多个样本图像对中各张样本图像的图像特征；基于多个样本图像对中各张样本图像的图像特征，确定多个样本图像对中各张样本图像的第一类别特征；基于多个样本图像对中各张样本图像的标注类别，确定多个样本图像对中各张样本图像的第二类别特征；基于多个样本图像对中各张样本图像的图像特征、第一类别特征和第二类别特征，对神经网络模型进行调整，得到特征提取模型。实现了利用样本图像的预测类别、标注类别约束模型来提取图像特征，提高了模型的准确性。权利要求书5页说明书30页附图6页 CN 114417046 B 2022.07.12 CN 114417046 B 1.一种特征提取模型的训练方法，其特征在于，所述方法包括：获取多个样本图像对和所述多个样本图像对中各张样本图像的标注类别，所述样本图像对包括两张相似的样本图像；根据神经网络模型获取所述多个样本图像对中各张样本图像的图像特征；基于所述多个样本图像对中各张样本图像的图像特征，确定所述多个样本图像对中各张样本图像的第一类别特征，所述样本图像的第一类别特征用于表征预测的所述样本图像的类别；基于所述多个样本图像对中各张样本图像的标注类别，确定所述多个样本图像对中各张样本图像的第二类别特征，所述样本图像的第二类别特征用于表征标注的所述样本图像的类别；对于任一个样本图像对，基于所述任一个样本图像对中至少一张样本图像的图像特征，确定所述任一个样本图像对的第一损失值；确定所述任一个样本图像对的三元组图像，所述任一个样本图像对的三元组图像包括所述任一个样本图像对和目标样本图像对中的一张样本图像，所述目标样本图像对是所述多个样本图像对中除所述任一个样本图像对之外且满足距离条件的样本图像对；基于所述任一个样本图像对的三元组图像中各张样本图像的图像特征，确定所述任一个样本图像对的第二损失值；基于所述多个样本图像对中各张样本图像的第一类别特征、第二类别特征和所述多个样本图像对的第一损失值、第二损失值，对所述神经网络模型进行调整，得到特征提取模型。 2.根据权利要求1所述的方法，其特征在于，所述样本图像的标注类别为至少一个，所述基于所述多个样本图像对中各张样本图像的标注类别，确定所述多个样本图像对中各张样本图像的第二类别特征，包括：对于所述多个样本图像对中各张样本图像的任一个标注类别，从多个候选类别中确定与所述任一个标注类别相同的候选类别，将与所述任一个标注类别相同的候选类别的类别特征确定为所述任一个标注类别的类别特征；对于所述多个样本图像对中的任一张样本图像，基于所述任一张样本图像的至少一个标注类别的类别特征，确定所述任一张样本图像的第二类别特征。 3.根据权利要求2所述的方法，其特征在于，所述将与所述任一个标注类别相同的候选类别的类别特征确定为所述任一个标注类别的类别特征之前，还包括：根据所述多个样本图像对中各张样本图像的标注类别，确定共现矩阵，所述共现矩阵中的任一个数据表征所述任一个数据所在行对应的候选类别与所述任一个数据所在列对应的候选类别共同出现的概率或者次数，一个标注类别是一个候选类别；基于阿达马矩阵和所述共现矩阵，确定各个候选类别的类别特征，所述阿达马矩阵的阶数大于候选类别的数量。 4.根据权利要求3所述的方法，其特征在于，所述样本图像的标注类别为至少两个，所述根据所述多个样本图像对中各张样本图像的标注类别，确定共现矩阵，包括：获取初始化矩阵，所述初始化矩阵的各行对应各个候选类别，且所述初始化矩阵的各列对应各个候选类别；权　利　要　求　书 1/5 页 2 CN 114417046 B 2对于所述多个样本图像对中的任一张样本图像，根据所述任一张样本图像的至少两个标注类别，在目标行和目标列的交叉位置处添加非零数据，所述目标行是所述初始化矩阵中与所述任一张样本图像的一个标注类别相同的候选类别所对应的行，所述目标列是所述初始化矩阵中与所述任一张样本图像的除所述一个标注类别之外的其他标注类别相同的候选类别所对应的列；将所述初始化矩阵中各行和各列的交叉位置处的非零数据进行累加，得到所述共现矩阵。 5.根据权利要求3所述的方法，其特征在于，所述基于阿达马矩阵和所述共现矩阵，确定各个候选类别的类别特征，包括：从未确定类别特征的候选类别中随机选择第一候选类别；从所述阿达马矩阵中随机选择未被使用过的一行数据，作为所述第一候选类别的类别特征；根据所述第一候选类别的类别特征和所述阿达马矩阵，确定所述共现矩阵中所述第一候选类别对应的行中各个非零数据所在列所对应的候选类别的类别特征；若存在所述未确定类别特征的候选类别，则从所述从未确定类别特征的候选类别中随机选择第一候选类别开始循环，直至不存在所述未确定类别特征的候选类别。 6.根据权利要求5所述的方法，其特征在于，所述根据所述第一候选类别的类别特征和所述阿达马矩阵，确定所述共现矩阵中所述第一候选类别对应的行中各个非零数据所在列所对应的候选类别的类别特征，包括：基于所述共现矩阵中所述第一候选类别对应的行中的各个非零数据，确定最大非零数据所在列所对应的且未确定类别特征的第二候选类别；从所述阿达马矩阵中确定与第一候选标签的类别特征最接近且未被使用过的一行数据，作为所述第二候选类别的类别特征；若所述共现矩阵中所述第一候选类别对应的行中存在未确定类别特征的且为非零数据所在列所对应的候选类别，则从所述基于所述共现矩阵中所述第一候选类别对应的行中的各个非零数据，确定最大非零数据所在列所对应的且未确定类别特征的第二候选类别开始循环，直至所述共现矩阵中所述第一候选类别对应的行中不存在未确定类别特征的且为非零数据所在列所对应的候选类别。 7.根据权利要求1所述的方法，其特征在于，所述基于所述任一个样本图像对中至少一张样本图像的图像特征，确定所述任一个样本图像对的第一损失值，包括：对所述任一个样本图像对中至少一张样本图像的图像特征进行二值化处理，得到所述任一个样本图像对中至少一张样本图像的二值图像特征；基于所述任一个样本图像对中至少一张样本图像的图像特征和二值图像特征，确定所述第一损失值。 8.根据权利要求1所述的方法，其特征在于，所述确定所述任一个样本图像对的三元组图像，包括：确定所述任一个样本图像对中的一张样本图像分别和各个其他样本图像对中的一张样本图像之间的第一距离信息，所述各个其他样本图像对是所述多个样本图像对中除所述任一个样本图像对之外的各个样本图像对；权　利　要　求　书 2/5 页 3 CN 114417046 B 3

专利 特征提取模型的训练方法、图像检索方法、装置及设备

专利特征提取模型的训练方法、图像检索方法、装置及设备