安全公司报告
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111402378.0 (22)申请日 2021.11.24 (71)申请人 深圳前海微众 银行股份有限公司 地址 518052 广东省深圳市前海深港合作 区前湾一路1号A栋201室 (72)发明人 陈伟敬 马国强 范涛  (74)专利代理 机构 北京派特恩知识产权代理有 限公司 1 1270 代理人 赵翠萍 张颖玲 (51)Int.Cl. G06F 30/27(2020.01) G06N 20/00(2019.01) (54)发明名称 联邦树模型的数据处理方法、 装置、 设备及 存储介质 (57)摘要 本申请提供了一种联邦树模型的数据处理 方法、 装置、 设备、 存储介质及程序产品, 应用于 第一参与方设备; 方法包括: 获取用作联邦树模 型的训练样 本的特征集合, 特征集合包括第一参 与方设备提供的第一特征、 以及第二参与方设备 提供的第二特征; 接收各第二参与方设备发送的 用于模拟联邦树模型的第一节 点路由; 获取各第 一特征所对应节点在联邦树模型中的第二节点 路由; 基于第一节点路由及第二节点路由, 得到 联邦树模型对应的伪联邦树模型; 通过伪联邦树 模型对特征集合所包括的特征子集进行预测, 得 到预测值, 并结合预测值及目标预测结果, 确定 特征集合中各特征对应目标预测结果的贡献信 息。 通过本申请, 能够快速、 准确的确定样本中各 特征的贡献信息 。 权利要求书3页 说明书26页 附图8页 CN 114065640 A 2022.02.18 CN 114065640 A 1.一种联邦树模型的数据处理方法, 其特征在于, 基于联邦学习系统, 所述联邦学习系 统包括第一参与方设备及至少一个第二参与方设备, 所述方法应用于第一参与方设备, 所 述方法包括: 获取用作 联邦树模型的训练样本的特征集合, 所述特征集合包括第 一参与方设备提供 的至少两个携带目标预测结果的第一特征、 以及所述第二参与方设备提供的至少一个第二 特征; 接收各所述第 二参与方设备发送的用于模拟所述联邦树模型的第 一节点路由, 所述第 一节点路由, 用于指示以所述第二特征作为所述联邦树模型 的分裂节点时, 所述分裂节点 对应的子节点路径; 获取所述至少两个第一特 征所对应节点在所述联邦树模型中的第二节点路由; 基于所述第一节点路由及所述第二节点路由, 模拟所述联邦树模型, 得到所述联邦树 模型对应的伪联邦树模型; 通过所述伪联邦树模型对所述特征集合所包括的特征子集进行预测, 得到相应的预测 值, 并结合所述预测 值及所述 目标预测结果, 确定所述特征集合中各特征对应所述 目标预 测结果的贡献信息 。 2.根据权利要求1所述的方法, 其特征在于, 所述接收各所述第 二参与方设备发送的用 于模拟所述联邦树模型的第一节点路由, 包括: 向各所述第 二参与方设备发送节点路由获取请求, 所述节点路由获取请求携带有训练 样本对应的样本标识; 接收到各所述第 二参与方设备基于所述节点路由获取请求, 返回的与 所述样本标识对 应的、 用于模拟所述联邦树模型的第一节点路由。 3.根据权利要求1所述的方法, 其特征在于, 所述基于所述第 一节点路由及所述第 二节 点路由, 模拟所述联邦树模型, 得到所述联邦树模型对应的伪联邦树模型, 包括: 创建所述联邦树模型的模型副本, 并从根节点开始对所述模型副本的每个节点进行遍 历; 当遍历到的当前节点对应的特征为所述第 二特征时, 获取与 所述第二参与方设备对应 的联邦特 征, 并将当前节点对应的特 征替换为所述联邦特 征; 根据所述第一节点路由所指示的子节点路径, 确定当前节点包括的子节点; 当遍历到的当前节点对应的特征为所述第一特征时, 执行针对其它节点的遍历, 直至 所述模型副本中的节点遍历完成, 将所述模型副本中对应所述第一特征 的第一节点、 对应 所述第二特征的第二节点、 所述第二节点包括的子节点所构成的树模型作为所述伪联邦模 型。 4.根据权利要求1所述的方法, 其特征在于, 所述基于所述第 一节点路由及所述第 二节 点路由, 模拟所述联邦树模型, 得到所述联邦树模型对应的伪联邦树模型, 包括: 创建初始树模型, 所述初始树模型中具有对应所述第一特征的节点, 且所述初始树模 型中的节点对应所述第二节点路由; 获取与所述第二 参与方设备存在一 一对应关系的联邦特 征; 根据所述第 一节点路由, 在所述初始树模型中创建对应所述联邦特征的节点及所述节 点包括的子节点, 以得到所述伪联邦树模型。权 利 要 求 书 1/3 页 2 CN 114065640 A 25.根据权利要求1所述的方法, 其特征在于, 所述通过所述伪联邦树模型对所述特征集 合所包括的特 征子集进行 预测, 得到相应的预测值, 包括: 针对所述特 征集合包括的各 特征子集, 分别执 行以下操作: 从所述伪联邦树模型的根节点 开始, 遍历所述伪联邦树模型的节点; 当遍历到的当前节点为非叶子节点, 且所述特征子集包括所述当前节点对应的特征 时, 获取所述当前节点对应的节点路由; 根据所述节点路由确定所述当前节点对应的叶子节点, 并将所述叶子节点对应的特征 值作为所述特 征子集的预测值。 6.根据权利要求1所述的方法, 其特征在于, 所述通过所述伪联邦树模型对所述特征集 合所包括的特 征子集进行 预测, 得到相应的预测值, 包括: 针对所述特 征集合包括的各 特征子集, 分别执 行以下操作: 从所述伪联邦树模型的根节点 开始, 遍历所述伪联邦树模型的节点; 当遍历到的当前节点为非叶子节点, 且所述特征子集不包括所述当前节点对应的特征 时, 获取所述当前节点对应的训练样本的第一数量; 获取所述当前节点的各子节点对应的训练样本的第二数量; 获取各所述子节点对应的预测值; 根据所述第一数量, 各所述第 二数量、 以及各所述子节点对应的预测值, 确定所述特征 子集对应的预测值。 7.根据权利要求6所述的方法, 其特征在于, 所述根据所述第 一数量, 各所述第 二数量、 以及各所述子节点对应的预测值, 确定所述特 征子集对应的预测值, 包括: 根据所述第一数量, 以及各所述第 二数量, 确定各所述子节点对应的权重, 基于各所述 子节点所对应的权重, 对各所述子节点对应的预测值进行加权处理, 得到所述当前节点对 应的预测值; 若所述当前节点为根节点, 将所述当前节点对应的预测值作为所述特征子集对应的预 测值; 若所述当前节点非根节点, 获取所述当前节点所在节点层中各节点的权重、 以及所述 节点层中各节点对应的预测 值, 对所述节点层中各节点对应的预测值进行加权处理, 得到 所述当前节点的父节点所对应的预测值, 若所述父节点为根节点, 将所述父节点对应的预 测值作为所述特征子集对应的预测值, 若 所述父节点 非根节点, 迭代执行上述处理, 直至得 到所述根节点对应的预测值, 作为所述特 征子集对应的预测值。 8.根据权利要求1所述的方法, 其特征在于, 所述结合所述预测值及所述目标预测结 果, 确定所述特 征集合中各特征对应所述目标 预测结果的贡献信息, 包括: 遍历所述特 征集合中的每 个特征, 并针对每 个所述特 征执行以下操作: 获取所述特征对应的第一预测值; 确定所述特 征集合的多个特 征子集中不包括所述特 征的目标 特征子集; 通过所述伪联邦树模型, 获取 各所述目标 特征子集对应的第二预测值; 基于所述第一预测值, 以及各所述第二预测值, 确定所述特征对各所述第二预测值的 边际贡献值; 基于各所述边际贡献值, 确定所述特 征对应所述目标 预测结果的贡献信息 。权 利 要 求 书 2/3 页 3 CN 114065640 A 3

.PDF文档 专利 联邦树模型的数据处理方法、装置、设备及存储介质

文档预览
中文文档 38 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共38页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 联邦树模型的数据处理方法、装置、设备及存储介质 第 1 页 专利 联邦树模型的数据处理方法、装置、设备及存储介质 第 2 页 专利 联邦树模型的数据处理方法、装置、设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-19 01:22:43上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。