安全公司报告
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211190845.2 (22)申请日 2022.09.28 (71)申请人 中国农业银行股份有限公司 地址 100005 北京市东城区建国门内大街 69号 (72)发明人 袁田 梁强 张效铭  (74)专利代理 机构 北京同立钧成知识产权代理 有限公司 1 1205 专利代理师 马姣琴 刘芳 (51)Int.Cl. G06K 9/62(2022.01) G06N 20/00(2019.01) G06Q 40/02(2012.01) (54)发明名称 数据处理方法、 装置和电子设备 (57)摘要 本申请提供了数据处理方法、 装置和电子设 备, 该数据处理方法包括: 获取待处理表单, 待处 理表单中具有目标空值; 在数据库中, 确定与待 处理表单匹配的多个目标源表, 待处理表单的第 一表名与目标源表的第二表名具有关联性; 在多 个目标源表中, 确定与目标空值具有相同关联信 息的目标字段值; 采用目标字段值填充待处理表 单中的目标空值, 得到目标表单。 本申请通过自 动化的方式对待处理表单中的空值进行准确快 速的填充, 得到符合 监管质量要求的目标表单。 权利要求书2页 说明书10页 附图5页 CN 115470861 A 2022.12.13 CN 115470861 A 1.一种数据处 理方法, 其特 征在于, 包括: 获取待处 理表单, 所述待处 理表单中具有目标空值; 在数据库中, 确定与所述待处理表单匹配的多个目标源表, 所述待处理表单的第一表 名与所述目标源表的第二表名具有关联性; 在所述多个目标源表中, 确定与所述目标空值具有相同关联信息的目标字段值; 采用所述目标字段值 填充所述待处 理表单中的所述目标空值, 得到目标表单。 2.根据权利要求1所述的数据处理方法, 其特征在于, 所述确定与所述待处理表单匹配 的多个目标源表, 包括: 确定与所述第一表名的字符串相似度大于相似度阈值的表名, 为所述第二表名; 确定具有所述第二表名的源表为所述目标源表。 3.根据权利要求2所述的数据处理方法, 其特征在于, 在未确定到与 所述第一表名的字 符串相似度大于相似度阈值的表名的情况下, 所述确定具有 所述第二表名的源表为所述目 标源表之前, 还 包括: 获取所述第一表名的目标 标签; 在所述数据库中, 确定表名属于所述目标 标签的多个源表; 在所述多个源表的表名中, 确定与所述第一表名的汉明距离小于预设距离阈值的表 名, 为所述第二表名。 4.根据权利要求3所述的数据处理方法, 其特征在于, 在未确定到与 所述第一表名的汉 明距离小于预设距离阈值的表名的情况下, 所述确定具有 所述第二表名的源表为所述目标 源表之前, 还 包括: 将所述数据库中的源表的表名和所述第一表名输入预先训练的自然语言处理模型进 行文本处理, 得到所述源表的表名对应的概率值, 所述第一表名和所述表名的相似度与所 述概率值呈正相关 关系; 确定所述 概率值大于概 率阈值的表名为所述第二表名。 5.根据权利要求 4所述的数据处 理方法, 其特 征在于, 还 包括: 确定所述目标字段值所属的目标源表的第三表名; 采用所述第三表名和所述第一表名作为 正例样本, 优化训练所述自然语言处 理模型。 6.根据权利要求1至5 中任一项所述的数据处理方法, 其特征在于, 所述关联信 息包括: 字段名称和相关信息, 所述在所述多个目标源表中, 确定与所述 目标空值具有相同关联信 息的目标字段值, 包括: 在所述待处 理表单中, 确定所述目标空值的字段名称和相关信息; 在所述多个目标源表中, 确定所述字段名称对应的字段值; 在所述字段值为多个的情况下, 在所述多个字段值中, 确定具有所述相关信息的字段 值为所述目标字段值。 7.根据权利要求1至5中任一项所述的数据处理方法, 其特征在于, 所述采用所述目标 字段值填充所述待处 理表单中的所述目标空值, 得到目标表单之后, 还 包括: 校验所述目标表单的格式和所述目标表单中的字符串, 得到校验通过的目标表单。 8.根据权利要求1至5中任一项所述的数据处理方法, 其特征在于, 所述采用所述目标 字段值填充所述待处 理表单中的所述目标空值, 得到目标表单之后还 包括:权 利 要 求 书 1/2 页 2 CN 115470861 A 2将所述目标表单发送给监管机构进行监管。 9.一种数据处 理装置, 其特 征在于, 包括: 获取模块, 用于获取待处 理表单, 所述待处 理表单中具有目标空值; 第一确定模块, 用于在数据库中, 确定与所述待处理表单匹配的多个目标源表, 所述待 处理表单的第一表名与所述目标源表的第二表名具有关联性; 第二确定模块, 用于在所述多个目标源表中, 确定与所述目标空值具有相同关联信息 的目标字段值; 填充模块, 用于采用所述目标字段值填充所述待处理表单中的所述目标空值, 得到目 标表单。 10.一种电子设备, 其特 征在于, 包括存 储器与处 理器; 其中, 所述存储器用于存 储程序代码; 所述处理器用于调用所述程序代码实现如权利要求1至8中任一项所述的数据处理方 法。权 利 要 求 书 2/2 页 3 CN 115470861 A 3

PDF文档 专利 数据处理方法、装置和电子设备

文档预览
中文文档 18 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 数据处理方法、装置和电子设备 第 1 页 专利 数据处理方法、装置和电子设备 第 2 页 专利 数据处理方法、装置和电子设备 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:07:04上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。