安全公司报告
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210992838.8 (22)申请日 2022.08.18 (71)申请人 安徽科讯金服科技有限公司 地址 230088 安徽省合肥市高新区望江西 路666号讯飞大厦A1-1 1层 (72)发明人 丁阳光 沈超锋 陈勇 谌纪超  (74)专利代理 机构 杭州君度专利代理事务所 (特殊普通 合伙) 33240 专利代理师 朱月芬 (51)Int.Cl. G06Q 40/02(2012.01) G06N 20/00(2019.01) G06F 21/60(2013.01) H04L 9/00(2022.01) (54)发明名称 基于联邦学习的银行与政务之间的数据处 理系统和方法 (57)摘要 本发明公开一种基于联邦学习的银行与政 务之间的数据处理系统和方法。 本发 明包括将银 行数据与政务数据存储到联邦学习系统; 对 银行 数据与政务数据进行预处理; 将银行数据与政务 数据各自真实的特征名进行加密; 将加密后的银 行数据与政务数据进行数据对齐; 将对齐后的数 据, 根据所需要的规范进行特征工程; 将处理后 的各自数据进行同态加密获取各自的训练数据; 发起方构建基于银行端和政务端的初步联邦学 习模型; 两端分别将各自训练数据输入到联邦学 习系统中进行联合训练建模生成最终的联邦学 习模型; 利用生成的联邦学习模 型对实际业务数 据进行联合预测并返回结果到发起方。 本发明解 决当前面临的数据孤岛效应, 采用数据本地不出 门也能进行联合建模。 权利要求书2页 说明书5页 附图3页 CN 115330524 A 2022.11.11 CN 115330524 A 1.基于联邦学习的银 行与政务之间的数据处 理方法, 其特 征在于, 包括: 步骤1: 将银 行数据与政务数据存 储到联邦学习 系统中; 步骤2: 对银行数据与政务数据进行预处理, 具体包括数据的筛选、 清洗、 ID值设置; 进 一步的, 预处理需要条件基于联邦学习算法和机器学习算法、 深度学习算法以及业务需要 的数据规范限制; 步骤3: 将银 行数据与政务数据的各自真实的特 征名进行加密; 步骤4: 将特征名加密后的银行数据与政务数据进行数据对齐; 将对齐后的数据, 根据 机器学习算法、 深度学习算法所需要的规范进行 特征工程; 步骤5: 将经 过步骤4处 理后的各自数据进行同态加密, 从而获取 各自的训练数据; 步骤6: 发起方利用机器学习模型或深度学习模型构建基于银行端和政务端的初步联 邦学习模型; 银行端和政务端分别将各自训练数据输入到联邦学习系统中进 行联合训练建 模, 并最终生成联邦学习模型; 步骤7: 利用步骤6生成的联邦学习模型, 对实际业务数据进行联合预测; 将预测结果返 回到发起方。 2.根据权利要求1所述基于联邦学习的银行与政务之间的数据处理方法, 其特征在于 步骤3中对银行数据和政务数据的真实特征名进行加密后得到加密后的密文特征名, 并且 映射加密后的密 文特征名与真实的特征名; 在整个后续训练步骤中所使用的特征名均为加 密后的密文特 征名。 3.根据权利要求1所述基于联邦学习的银行与政务之间的数据处理方法, 其特征在于 所述步骤5中对银行数据和政务数据进行同态加密, 并且加密后的数据保存在各自的联邦 学习系统的数据存储模块中; 在整个后续训练步骤中所使用的数据均为同态加密后的密 文 数据; 所述步骤4中数据对齐, 是根据银行数据和政务数据的各自的ID进行两次hash算法进 行数据对齐。 4.根据权利要求1所述基于联邦学习的银行与政务之间的数据处理方法, 其特征在于 所述步骤6中的联邦学习模 型具体包括: 银行端和政务端拥有 各自的半模型、 银行端 所设置 的模型类型、 联邦学习模型训练参数, 且模型训练参数在银行数据端和政务数据端是一致 的。 5.根据权利要求1所述基于联邦学习的银行与政务之间的数据处理方法, 其特征在于 所述步骤6中的联合建模具体包括: 银行端根据自身的数据进 行本地的半模型训练, 政务端 根据自身的数据进行本地的半模型训练, 各自训练完毕后在联邦学习系统中进行整个联邦 学习模型的损失计算, 银行端和政务端根据整个联邦学习模型的损失求得各自的梯度并且 进行各自半模型的更新。 6.根据权利要求1或2或3或4或5所述基于联邦学习的银行与政务之间的数据处理方 法, 其特征在于, 所述步骤6和步骤7中的发起方是指: 拥有样本标签的那一方, 是银行端或 政务端。 7.基于联邦学习的银行与政务之间的数据处理系统, 其特征在于该系统包括数据存储 模块、 数据预 处理模块、 数据加密和数据对齐模块、 数据特征工程模块、 同态加密 模块、 模型 构建与训练模块和模型推理模块; 数据存储模块: 配置用于将银 行数据与政务数据存 储到联邦学习 系统中;权 利 要 求 书 1/2 页 2 CN 115330524 A 2数据预处理模块: 用于对银行数据与政务数据进行预处理, 具体包括数据的筛选、 清 洗、 ID值设置; 且预 处理需要 条件基于联邦学习算法和机器学习算法、 深度学习算法以及业 务需要的数据规范限制; 数据加密和数据对齐模块: 配置用于将银行数据与政务数据的各自真实特征名进行加 密, 以及将特 征名加密后的银 行数据与政务数据进行 数据对齐; 数据特征工程模块: 用于将对齐后的数据, 根据机器学习算法、 深度 学习算法所需要的 规范进行 特征工程; 同态加密模块: 将经过数据特征工程模块处理后得到的数据进行同态加密, 从而获取 各自的训练数据; 模型构建与训练模块: 发起方利用机器学习 模型或深度 学习模型构建基于银行端和政 务端的初步联邦学习模型; 银行端和政务端分别将各自训练数据输入到联邦学习系统中进 行联合训练建模, 并最终生成联邦学习模型; 模型推理模块: 利用生成的联邦学习模型, 对实际业务数据进行联合预测; 将预测结果 返回到发起方。 8.根据权利要求7所述基于联邦学习的银行与政务之间的数据处理系统, 其特征在于 所述发起方 是指: 拥有样本标签的那一方, 是 银行端或政务端。权 利 要 求 书 2/2 页 3 CN 115330524 A 3

PDF文档 专利 基于联邦学习的银行与政务之间的数据处理系统和方法

文档预览
中文文档 11 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共11页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于联邦学习的银行与政务之间的数据处理系统和方法 第 1 页 专利 基于联邦学习的银行与政务之间的数据处理系统和方法 第 2 页 专利 基于联邦学习的银行与政务之间的数据处理系统和方法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:07:07上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。