安全公司报告
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211291571.6 (22)申请日 2022.10.19 (71)申请人 联仁健康医疗大 数据科技股份有限 公司 地址 200131 上海市浦东 新区中国 (上海) 自由贸易试验区川和路5 5弄3号 (72)发明人 黄皓 李天一 朱靖源  (74)专利代理 机构 北京品源专利代理有限公司 11332 专利代理师 王瑞云 (51)Int.Cl. G16H 50/70(2018.01) G06N 3/08(2006.01) G06N 3/04(2006.01) G06K 9/62(2022.01) (54)发明名称 一种数据处 理方法、 装置、 设备及存 储介质 (57)摘要 本发明公开了一种数据处理方法、 装置、 设 备及存储介质。 该方法包括接收待处理数据; 其 中, 待处理数据中包括两个用户的健康数据和用 户基本信息; 将各用户的健康数据输入至相应的 健康数据孪生网络模型中, 得到与各健康数据所 对应的第一向量, 并确定两个第一向量之间的相 似度; 将两个用户的用户基本信息和相似度输入 至预先训练得到的判别模型中, 确定两个用户之 间的综合相似度; 基于综合相似度, 确定是否对 两个用户的待处理数据合并处理。 本发明实施方 案, 不仅构造出适用性更强的用户主索引匹配系 统, 提升了健康大数据中心的数据关联度, 还实 现了各个系统中相似用户信息的整合, 为后续信 息调取、 使用提供了 便利。 权利要求书2页 说明书10页 附图4页 CN 115497633 A 2022.12.20 CN 115497633 A 1.一种数据处 理方法, 其特 征在于, 包括: 接收待处 理数据; 其中, 所述待处 理数据中包括两个用户的健康数据和用户基本信息; 将各用户的健康数据输入至相应的健康数据孪生网络模型中, 得到与 各健康数据 所对 应的第一向量, 并确定 两个第一向量之间的相似度; 将所述两个用户的用户基本信 息和所述相似度输入至预先训练得到的判别模型中, 确 定所述两个用户之间的综合相似度; 基于所述综合相似度, 确定是否对两个用户的待处 理数据合并处 理。 2.根据权利要求1所述的方法, 其特征在于, 所述将各用户的健康数据输入至相应的健 康数据孪生网络模型中, 得到与各健康数据所对应的第一向量, 并确定两个第一向量之间 的相似度, 包括: 将其中一个用户的健康数据输入至第一健康数据孪生模型中, 得到待处理第一向量, 将另一用户的健康数据输入至第二 健康数据孪生模型中, 得到待处 理第二向量; 基于预设相似度算法确定所述待处 理第一向量和所述待处 理第二向量之间的相似度; 其中, 所述第一 健康数据孪生模型和所述第二 健康数据孪生模型的模型 结构相同。 3.根据权利要求1所述的方法, 其特征在于, 所述将各用户的用户基本信 息和所述相似 度输入至预 先训练得到的判别模型中, 确定所述两个用户之间的综合相似度, 包括: 对于两个用户的基本信息进行 特征匹配处 理, 得到特 征匹配向量; 通过对所述特 征匹配向量和所述相似度拼接处 理, 得到目标向量; 将所述目标向量输入至所述判别模型中, 得到所述两个用户之间的综合相似度。 4.根据权利要求3所述的方法, 其特征在于, 所述用户基本信 息中包括多个字段所对应 的字段内容, 所述对两个用户的基本信息进行 特征匹配处 理, 得到特 征匹配向量, 包括: 通过对同一字段 所对应的字段内容匹配处 理, 得到相应字段 所对应的匹配特 征; 基于各字段 所对应的匹配特 征, 确定所述特 征匹配向量。 5.根据权利要求1所述的方法, 其特 征在于, 还 包括: 确定训练样本集, 所述训练样本集中包括多个训练样本, 所述训练样本中包括正样本 以及相应的正标签、 负 样本以及相应的负标签; 对于各训练样本, 将当前训练样本输入至待训练判别模型中, 得到相应的实 际输出相 似度值; 基于所述实 际输出相似度值和所述当前训练样本的标签, 确定损 失值, 以基于所述损 失值对所述待训练判别模型中的模型参数进行修 正; 将所述待训练判别模型中的损失函数收敛作为训练目标, 得到所述判别模型。 6.根据权利要求5所述的方法, 其特征在于, 所述基于所述综合相似度, 确定是否对两 个用户的待处 理数据合并处 理, 包括: 若所述综合相似度高于第一预设相似度阈值, 则将两个用户的待处 理数据合并处 理; 若所述综合相似度小于第 二预设相似度阈值, 则拒 绝将两个用户的待处理数据合并处 理; 若所述综合相似度大于所述第二预设相似度阈值, 且小于所述第一预设相似度阈值, 则将所述两个用户的待处理数据发送至目标设备, 以使所述目标设备所对应的审核用户对 所述待处 理数据审核处 理。权 利 要 求 书 1/2 页 2 CN 115497633 A 27.根据权利要求1所述的方法, 其特 征在于, 还 包括: 周期性的获取相应的训练样本分别对所述判别模型以及健康数据孪生网络模型中的 模型参数进行更新, 以基于更新后的判别模型和所述健康数据孪生网络模 型对数据进 行处 理。 8.一种数据处 理装置, 其特 征在于, 所述装置包括: 数据接收模块: 用于 接收两组待处 理数据。 其中, 待处 理数据中包括两个用户的健康数据和用户基本信息; 相似度计算模块: 用于将各用户的健康数据输入至相应的健康数据孪生网络模型中, 得到与各健康数据所对应的第一向量, 并确定 两个第一向量之间的相似度; 综合相似度计算模块: 用于将所述两个用户的用户基本信 息和所述相似度输入至预先 训练得到的判别模型中, 确定所述两个用户之间的综合相似度。 决策模块: 用于基于所述综合相似度, 确定是否对两个用户的待处 理数据合并处 理。 9.一种电子设备, 其特 征在于, 所述电子设备包括: 至少一个处 理器; 以及 与所述至少一个处 理器通信连接的存 储器; 其中, 所述存储器存储有可被所述至少一个处理器执行的计算机程序, 所述计算机程序被所 述至少一个处理器执行, 以使所述至少一个处理器能够执行权利要求1 ‑7中任一项所述的 数据处理方法。 10.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质存储有计算机指 令, 所述计算机指令用于使处 理器执行时实现权利要求1 ‑7中任一项所述的数据处 理方法。权 利 要 求 书 2/2 页 3 CN 115497633 A 3

PDF文档 专利 一种数据处理方法、装置、设备及存储介质

文档预览
中文文档 17 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种数据处理方法、装置、设备及存储介质 第 1 页 专利 一种数据处理方法、装置、设备及存储介质 第 2 页 专利 一种数据处理方法、装置、设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:35:48上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。