安全公司报告
文库搜索
切换导航
文件分类
频道
联系我们
问题反馈
文件分类
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211291571.6 (22)申请日 2022.10.19 (71)申请人 联仁健康医疗大 数据科技股份有限 公司 地址 200131 上海市浦东 新区中国 (上海) 自由贸易试验区川和路5 5弄3号 (72)发明人 黄皓 李天一 朱靖源 (74)专利代理 机构 北京品源专利代理有限公司 11332 专利代理师 王瑞云 (51)Int.Cl. G16H 50/70(2018.01) G06N 3/08(2006.01) G06N 3/04(2006.01) G06K 9/62(2022.01) (54)发明名称 一种数据处 理方法、 装置、 设备及存 储介质 (57)摘要 本发明公开了一种数据处理方法、 装置、 设 备及存储介质。 该方法包括接收待处理数据; 其 中, 待处理数据中包括两个用户的健康数据和用 户基本信息; 将各用户的健康数据输入至相应的 健康数据孪生网络模型中, 得到与各健康数据所 对应的第一向量, 并确定两个第一向量之间的相 似度; 将两个用户的用户基本信息和相似度输入 至预先训练得到的判别模型中, 确定两个用户之 间的综合相似度; 基于综合相似度, 确定是否对 两个用户的待处理数据合并处理。 本发明实施方 案, 不仅构造出适用性更强的用户主索引匹配系 统, 提升了健康大数据中心的数据关联度, 还实 现了各个系统中相似用户信息的整合, 为后续信 息调取、 使用提供了 便利。 权利要求书2页 说明书10页 附图4页 CN 115497633 A 2022.12.20 CN 115497633 A 1.一种数据处 理方法, 其特 征在于, 包括: 接收待处 理数据; 其中, 所述待处 理数据中包括两个用户的健康数据和用户基本信息; 将各用户的健康数据输入至相应的健康数据孪生网络模型中, 得到与 各健康数据 所对 应的第一向量, 并确定 两个第一向量之间的相似度; 将所述两个用户的用户基本信 息和所述相似度输入至预先训练得到的判别模型中, 确 定所述两个用户之间的综合相似度; 基于所述综合相似度, 确定是否对两个用户的待处 理数据合并处 理。 2.根据权利要求1所述的方法, 其特征在于, 所述将各用户的健康数据输入至相应的健 康数据孪生网络模型中, 得到与各健康数据所对应的第一向量, 并确定两个第一向量之间 的相似度, 包括: 将其中一个用户的健康数据输入至第一健康数据孪生模型中, 得到待处理第一向量, 将另一用户的健康数据输入至第二 健康数据孪生模型中, 得到待处 理第二向量; 基于预设相似度算法确定所述待处 理第一向量和所述待处 理第二向量之间的相似度; 其中, 所述第一 健康数据孪生模型和所述第二 健康数据孪生模型的模型 结构相同。 3.根据权利要求1所述的方法, 其特征在于, 所述将各用户的用户基本信 息和所述相似 度输入至预 先训练得到的判别模型中, 确定所述两个用户之间的综合相似度, 包括: 对于两个用户的基本信息进行 特征匹配处 理, 得到特 征匹配向量; 通过对所述特 征匹配向量和所述相似度拼接处 理, 得到目标向量; 将所述目标向量输入至所述判别模型中, 得到所述两个用户之间的综合相似度。 4.根据权利要求3所述的方法, 其特征在于, 所述用户基本信 息中包括多个字段所对应 的字段内容, 所述对两个用户的基本信息进行 特征匹配处 理, 得到特 征匹配向量, 包括: 通过对同一字段 所对应的字段内容匹配处 理, 得到相应字段 所对应的匹配特 征; 基于各字段 所对应的匹配特 征, 确定所述特 征匹配向量。 5.根据权利要求1所述的方法, 其特 征在于, 还 包括: 确定训练样本集, 所述训练样本集中包括多个训练样本, 所述训练样本中包括正样本 以及相应的正标签、 负 样本以及相应的负标签; 对于各训练样本, 将当前训练样本输入至待训练判别模型中, 得到相应的实 际输出相 似度值; 基于所述实 际输出相似度值和所述当前训练样本的标签, 确定损 失值, 以基于所述损 失值对所述待训练判别模型中的模型参数进行修 正; 将所述待训练判别模型中的损失函数收敛作为训练目标, 得到所述判别模型。 6.根据权利要求5所述的方法, 其特征在于, 所述基于所述综合相似度, 确定是否对两 个用户的待处 理数据合并处 理, 包括: 若所述综合相似度高于第一预设相似度阈值, 则将两个用户的待处 理数据合并处 理; 若所述综合相似度小于第 二预设相似度阈值, 则拒 绝将两个用户的待处理数据合并处 理; 若所述综合相似度大于所述第二预设相似度阈值, 且小于所述第一预设相似度阈值, 则将所述两个用户的待处理数据发送至目标设备, 以使所述目标设备所对应的审核用户对 所述待处 理数据审核处 理。权 利 要 求 书 1/2 页 2 CN 115497633 A 27.根据权利要求1所述的方法, 其特 征在于, 还 包括: 周期性的获取相应的训练样本分别对所述判别模型以及健康数据孪生网络模型中的 模型参数进行更新, 以基于更新后的判别模型和所述健康数据孪生网络模 型对数据进 行处 理。 8.一种数据处 理装置, 其特 征在于, 所述装置包括: 数据接收模块: 用于 接收两组待处 理数据。 其中, 待处 理数据中包括两个用户的健康数据和用户基本信息; 相似度计算模块: 用于将各用户的健康数据输入至相应的健康数据孪生网络模型中, 得到与各健康数据所对应的第一向量, 并确定 两个第一向量之间的相似度; 综合相似度计算模块: 用于将所述两个用户的用户基本信 息和所述相似度输入至预先 训练得到的判别模型中, 确定所述两个用户之间的综合相似度。 决策模块: 用于基于所述综合相似度, 确定是否对两个用户的待处 理数据合并处 理。 9.一种电子设备, 其特 征在于, 所述电子设备包括: 至少一个处 理器; 以及 与所述至少一个处 理器通信连接的存 储器; 其中, 所述存储器存储有可被所述至少一个处理器执行的计算机程序, 所述计算机程序被所 述至少一个处理器执行, 以使所述至少一个处理器能够执行权利要求1 ‑7中任一项所述的 数据处理方法。 10.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质存储有计算机指 令, 所述计算机指令用于使处 理器执行时实现权利要求1 ‑7中任一项所述的数据处 理方法。权 利 要 求 书 2/2 页 3 CN 115497633 A 3
专利 一种数据处理方法、装置、设备及存储介质
文档预览
中文文档
17 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
赞助2元下载(无需注册)
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2元下载
本文档由 SC 于
2024-02-18 22:35:48
上传分享
举报
下载
原文档
(789.3 KB)
分享
友情链接
DB11-T 2163-2023 固定资产投资项目节能审查事中评价规范 北京市.pdf
DB31-T 25-2020 热处理电热设备节能监测与经济运行 上海市.pdf
GB-T 24369.3-2017 金纳米棒表征 第3部分:表面电荷密度测量方法.pdf
GB-T 6312-2022 壁厚千分尺.pdf
GB-T 41072-2021 表面化学分析 电子能谱 紫外光电子能谱分析指南.pdf
GB-T 19228.2-2011 不锈钢卡压式管件组件 第2部分:连接用薄壁不锈钢管.pdf
GB-T 12604.10-2023 无损检测 术语 第10部分:磁记忆检测.pdf
T-CSTM 00837—2022 材料基因工程数据 元数据标准化基本原则与方法.pdf
T-CSAE 190.4—2021 汽车用轮毂电动轮总成可靠性试验方法.pdf
数据安全框架202308.pptx
GB/T 40997-2021 经外奇穴名称与定位.pdf
DB11-T 715-2018 公共汽电车场站功能设计要求 北京市.pdf
GB-T 42815-2023 债券价格指标产品描述规范.pdf
GB-T 10357.4-2023 家具力学性能试验 第4部分:柜类稳定性.pdf
GB-T 33658-2017 室内人体热舒适环境要求与评价方法.pdf
T-CAAMTB 134—2023 质量分级及“领跑者”评价要求 电动汽车用驱动电机系统.pdf
QX-T 210-2013 城市景观照明设施防雷技术规范.pdf
信通院 人工智能生成内容 AIGC 白皮书 2022年.pdf
GB-T 15843.4-2008 信息技术 安全技术 实体鉴别 第4部分 采用密码校验函数的机制.pdf
GM-T 0063-2018 智能密码钥匙密码应用接口检测规范.pdf
交流群
-->
1
/
17
评价文档
赞助2元 点击下载(789.3 KB)
回到顶部
×
微信扫码支付
2
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。