(19)中华 人民共和国 国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202111402378.0
(22)申请日 2021.11.24
(71)申请人 深圳前海微众 银行股份有限公司
地址 518052 广东省深圳市前海深港合作
区前湾一路1号A栋201室
(72)发明人 陈伟敬 马国强 范涛
(74)专利代理 机构 北京派特恩知识产权代理有
限公司 1 1270
代理人 赵翠萍 张颖玲
(51)Int.Cl.
G06F 30/27(2020.01)
G06N 20/00(2019.01)
(54)发明名称
联邦树模型的数据处理方法、 装置、 设备及
存储介质
(57)摘要
本申请提供了一种联邦树模型的数据处理
方法、 装置、 设备、 存储介质及程序产品, 应用于
第一参与方设备; 方法包括: 获取用作联邦树模
型的训练样 本的特征集合, 特征集合包括第一参
与方设备提供的第一特征、 以及第二参与方设备
提供的第二特征; 接收各第二参与方设备发送的
用于模拟联邦树模型的第一节 点路由; 获取各第
一特征所对应节点在联邦树模型中的第二节点
路由; 基于第一节点路由及第二节点路由, 得到
联邦树模型对应的伪联邦树模型; 通过伪联邦树
模型对特征集合所包括的特征子集进行预测, 得
到预测值, 并结合预测值及目标预测结果, 确定
特征集合中各特征对应目标预测结果的贡献信
息。 通过本申请, 能够快速、 准确的确定样本中各
特征的贡献信息 。
权利要求书3页 说明书26页 附图8页
CN 114065640 A
2022.02.18
CN 114065640 A
1.一种联邦树模型的数据处理方法, 其特征在于, 基于联邦学习系统, 所述联邦学习系
统包括第一参与方设备及至少一个第二参与方设备, 所述方法应用于第一参与方设备, 所
述方法包括:
获取用作 联邦树模型的训练样本的特征集合, 所述特征集合包括第 一参与方设备提供
的至少两个携带目标预测结果的第一特征、 以及所述第二参与方设备提供的至少一个第二
特征;
接收各所述第 二参与方设备发送的用于模拟所述联邦树模型的第 一节点路由, 所述第
一节点路由, 用于指示以所述第二特征作为所述联邦树模型 的分裂节点时, 所述分裂节点
对应的子节点路径;
获取所述至少两个第一特 征所对应节点在所述联邦树模型中的第二节点路由;
基于所述第一节点路由及所述第二节点路由, 模拟所述联邦树模型, 得到所述联邦树
模型对应的伪联邦树模型;
通过所述伪联邦树模型对所述特征集合所包括的特征子集进行预测, 得到相应的预测
值, 并结合所述预测 值及所述 目标预测结果, 确定所述特征集合中各特征对应所述 目标预
测结果的贡献信息 。
2.根据权利要求1所述的方法, 其特征在于, 所述接收各所述第 二参与方设备发送的用
于模拟所述联邦树模型的第一节点路由, 包括:
向各所述第 二参与方设备发送节点路由获取请求, 所述节点路由获取请求携带有训练
样本对应的样本标识;
接收到各所述第 二参与方设备基于所述节点路由获取请求, 返回的与 所述样本标识对
应的、 用于模拟所述联邦树模型的第一节点路由。
3.根据权利要求1所述的方法, 其特征在于, 所述基于所述第 一节点路由及所述第 二节
点路由, 模拟所述联邦树模型, 得到所述联邦树模型对应的伪联邦树模型, 包括:
创建所述联邦树模型的模型副本, 并从根节点开始对所述模型副本的每个节点进行遍
历;
当遍历到的当前节点对应的特征为所述第 二特征时, 获取与 所述第二参与方设备对应
的联邦特 征, 并将当前节点对应的特 征替换为所述联邦特 征;
根据所述第一节点路由所指示的子节点路径, 确定当前节点包括的子节点;
当遍历到的当前节点对应的特征为所述第一特征时, 执行针对其它节点的遍历, 直至
所述模型副本中的节点遍历完成, 将所述模型副本中对应所述第一特征 的第一节点、 对应
所述第二特征的第二节点、 所述第二节点包括的子节点所构成的树模型作为所述伪联邦模
型。
4.根据权利要求1所述的方法, 其特征在于, 所述基于所述第 一节点路由及所述第 二节
点路由, 模拟所述联邦树模型, 得到所述联邦树模型对应的伪联邦树模型, 包括:
创建初始树模型, 所述初始树模型中具有对应所述第一特征的节点, 且所述初始树模
型中的节点对应所述第二节点路由;
获取与所述第二 参与方设备存在一 一对应关系的联邦特 征;
根据所述第 一节点路由, 在所述初始树模型中创建对应所述联邦特征的节点及所述节
点包括的子节点, 以得到所述伪联邦树模型。权 利 要 求 书 1/3 页
2
CN 114065640 A
25.根据权利要求1所述的方法, 其特征在于, 所述通过所述伪联邦树模型对所述特征集
合所包括的特 征子集进行 预测, 得到相应的预测值, 包括:
针对所述特 征集合包括的各 特征子集, 分别执 行以下操作:
从所述伪联邦树模型的根节点 开始, 遍历所述伪联邦树模型的节点;
当遍历到的当前节点为非叶子节点, 且所述特征子集包括所述当前节点对应的特征
时, 获取所述当前节点对应的节点路由;
根据所述节点路由确定所述当前节点对应的叶子节点, 并将所述叶子节点对应的特征
值作为所述特 征子集的预测值。
6.根据权利要求1所述的方法, 其特征在于, 所述通过所述伪联邦树模型对所述特征集
合所包括的特 征子集进行 预测, 得到相应的预测值, 包括:
针对所述特 征集合包括的各 特征子集, 分别执 行以下操作:
从所述伪联邦树模型的根节点 开始, 遍历所述伪联邦树模型的节点;
当遍历到的当前节点为非叶子节点, 且所述特征子集不包括所述当前节点对应的特征
时, 获取所述当前节点对应的训练样本的第一数量;
获取所述当前节点的各子节点对应的训练样本的第二数量;
获取各所述子节点对应的预测值;
根据所述第一数量, 各所述第 二数量、 以及各所述子节点对应的预测值, 确定所述特征
子集对应的预测值。
7.根据权利要求6所述的方法, 其特征在于, 所述根据所述第 一数量, 各所述第 二数量、
以及各所述子节点对应的预测值, 确定所述特 征子集对应的预测值, 包括:
根据所述第一数量, 以及各所述第 二数量, 确定各所述子节点对应的权重, 基于各所述
子节点所对应的权重, 对各所述子节点对应的预测值进行加权处理, 得到所述当前节点对
应的预测值;
若所述当前节点为根节点, 将所述当前节点对应的预测值作为所述特征子集对应的预
测值;
若所述当前节点非根节点, 获取所述当前节点所在节点层中各节点的权重、 以及所述
节点层中各节点对应的预测 值, 对所述节点层中各节点对应的预测值进行加权处理, 得到
所述当前节点的父节点所对应的预测值, 若所述父节点为根节点, 将所述父节点对应的预
测值作为所述特征子集对应的预测值, 若 所述父节点 非根节点, 迭代执行上述处理, 直至得
到所述根节点对应的预测值, 作为所述特 征子集对应的预测值。
8.根据权利要求1所述的方法, 其特征在于, 所述结合所述预测值及所述目标预测结
果, 确定所述特 征集合中各特征对应所述目标 预测结果的贡献信息, 包括:
遍历所述特 征集合中的每 个特征, 并针对每 个所述特 征执行以下操作:
获取所述特征对应的第一预测值;
确定所述特 征集合的多个特 征子集中不包括所述特 征的目标 特征子集;
通过所述伪联邦树模型, 获取 各所述目标 特征子集对应的第二预测值;
基于所述第一预测值, 以及各所述第二预测值, 确定所述特征对各所述第二预测值的
边际贡献值;
基于各所述边际贡献值, 确定所述特 征对应所述目标 预测结果的贡献信息 。权 利 要 求 书 2/3 页
3
CN 114065640 A
3
专利 联邦树模型的数据处理方法、装置、设备及存储介质
文档预览
中文文档
38 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共38页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-19 01:22:43上传分享