安全公司报告
(19)中华 人民共和国 国家知识产权局 (12)发明 专利 (10)授权公告 号 (45)授权公告日 (21)申请 号 202111460791.2 (22)申请日 2021.12.02 (65)同一申请的已公布的文献号 申请公布号 CN 113869530 A (43)申请公布日 2021.12.31 (73)专利权人 北京华品博睿网络技 术有限公司 地址 100028 北京市朝阳区太阳宫中路16 号院1号楼18层1801内09 (72)发明人 张险全 薛延波 赵鹏  (74)专利代理 机构 北京君泊知识产权代理有限 公司 11496 代理人 周倩 (51)Int.Cl. G06N 20/00(2019.01) G06F 9/54(2006.01)(56)对比文件 CN 113419750 A,2021.09.21 CN 113610239 A,2021.1 1.05 US 2020134696 A1,2020.04.3 0 CN 111242320 A,2020.0 6.05 审查员 高民芳 (54)发明名称 一种机器学习在线特 征生产系统和方法 (57)摘要 本发明实施例公开了一种机器学习在线特 征生产系统, 包括: 远程模式业务应用集群, 第一 应用节点通过远程模式调用特征服务集群; 特征 服务集群, 特征服务节点 从特征存储库中获取第 一特征并执行特征处理和特征算子运算, 输出结 果; 特征代理主节点集群, 特征代理主节点对第 一本地存储库中的全量特征定时生成全量特征 快照; 内嵌模式业务应用集群, 第二应用节点通 过特征代理SDK下载全量特征快照并构建全量特 征, 从第二本地存储库中获取第二特征并执行特 征处理和特征算子运算, 输出处理结果。 本发明 实施例还公开了一种机器学习在线特征生产方 法。 本发明在生产特征时无需存储, 效率高且存 储成本低, 同一特征支持多种生产方式, 减少获 取大体量特 征时的延迟, 获取效率高。 权利要求书4页 说明书12页 附图1页 CN 113869530 B 2022.03.01 CN 113869530 B 1.一种机器学习在线特 征生产系统, 其特 征在于, 所述系统包括: 远程模式业务应用集群, 包括多个第一应用节点, 各个第一应用节点通过远程模式调 用特征服务集群; 特征服务集群, 包括多个特征服务节点, 各个特征服务节点根据所述远程模式业务应 用集群的应用 调用请求, 通过特征获取模块从特征存储库中获取第一特征, 并通过第一特 征处理插件和 第一特征算子执行模块对所述第一特征执行特征 处理和特征算子运算, 输出 符合特征元数据定义的处 理结果; 特征代理主节点集群, 包括多个特征代理主节点, 各个特征代理主节点通过特征订阅 的方式维护各个第一本地存储库中的特征, 并分别对各个第一本地存储库中的全量特征定 时生成全量特 征快照, 其中, 所述第一本地存 储库为特 征代理主节点的本地存 储库; 内嵌模式业务应用集群, 包括多个第二应用节点, 每个第二应用节点封装有特征代理 SDK, 各个第二应用节点初始 化特征时通过特征代理SDK从各个特征代理主节 点下载全量特 征快照并在各个第二本地存储库中构建全量特征, 各个第二应用节点还根据所述内嵌模式 业务应用集群的应用调用请求, 通过特征代理SDK从各个第二本地存储库中获取第二特征, 并通过第二特征处理插件和第二特征算子执行模块对所述第二特征执行特征处理和特征 算子运算, 输出符合特征元数据定义的处理结果, 其中, 所述第二本地存储库为第二应用节 点的本地存 储库。 2.如权利要求1所述的系统, 其中, 所述各个特征服务节点根据 所述远程模式业务应用 集群的应用调用请求, 通过 特征获取模块从特 征存储库中获取第一特 征, 包括: 各个特征服务节点根据 所述远程模式业务应用集群的应用调用请求, 通过所述特征获 取模块从特 征元数据库中加载第一特 征元数据; 根据所述第一特 征元数据确定所述特 征存储库中所述第一特 征是否依赖 于其他特征; 在确定所述第 一特征依赖于其他特征时, 通过所述特征获取模块从所述特征存储库中 获取所述第一特 征依赖的全部特 征; 在确定所述第 一特征不依赖于其他特征时, 通过所述特征获取模块从所述特征存储库 中直接获取 所述第一特 征。 3.如权利要求2所述的系统, 其中, 所述第 一特征处理插件和所述第 一特征算子执行模 块根据所述第一特 征元数据在各个特 征服务节点中被加载。 4.如权利要求1所述的系统, 其中, 所述第 一特征算子执行模块中执行的特征算子包括 特征类型转换算子、 特征映射算子、 特征分段算子、 特征离散化算子以及特征归一化算子中 的一种或多种。 5.如权利要求1所述的系统, 其中, 所述特 征获取模块被封装为支持异构数据源, 所述特征存储库是一个或多个存储库, 所述多个存储库 是相同数据类型或不同数据类 型的存储库。 6.如权利要求1所述的系统, 其中, 所述各个第 二应用节点根据 所述内嵌模式业务应用 集群的应用调用请求从各个第二本地存 储库中获取第二特 征, 包括: 各个第二应用节点根据 所述内嵌模式业务应用集群的应用调用请求, 通过所述特征代 理SDK从特征元数据存储库中加载第二特 征元数据; 根据所述第 二特征元数据确定目标本地存储库中所述第 二特征是否依赖于其他特征,权 利 要 求 书 1/4 页 2 CN 113869530 B 2所述目标本地存 储库为多个第二本地存 储库中的一个或多个; 在确定所述第二特征依赖于其他特征时, 通过特征代理SDK从所述目标本地存储库中 获取所述第二特 征依赖的全部特 征; 在确定所述第二特征不依赖于其他特征时, 通过特征代理SDK从所述目标本地存储库 中直接获取 所述第二特 征。 7.如权利要求6所述的系统, 其中, 所述第 二特征处理插件和所述第 二特征算子执行模 块根据所述第二特 征元数据在各个第二应用节点中被加载。 8.如权利要求1所述的系统, 其中, 所述第 二特征算子执行模块中执行的特征算子包括 特征类型转换算子、 特征映射算子、 特征分段算子、 特征离散化算子以及特征归一化算子中 的一种或多种。 9.如权利要求1所述的系统, 其中, 各个第 一本地存储库中的全量特征包括各个特征代 理节点的本地存 储库中持久化存 储的订阅特 征和第一变更 特征, 所述订阅特征为各个特征代 理主节点初始化 时从所述特征存储库中加载获得, 所述第 一变更特征为各个特征代理主节点根据设置的消息队列偏移位置从特征消息队列中消费 消息获得。 10.如权利要求9所述的系统, 其中, 各个第 二应用节点初始化特征时还包括: 通过特征 代理SDK设置消息队列偏移位置并从所述特征消息队列中消费信息, 以从所述特征消息队 列中获取第二变更 特征并同步至第二本地存 储库中。 11.一种机器学习在线特 征生产方法, 其特 征在于, 所述方法包括: S1, 初始化远程模式业务应用集群中的每个第一应用节点、 特征服务集群中的每个特 征服务节点、 特征代理主节点集群中的每个特征代理主节点和内嵌模式业务应用集群中的 每个第二应用节点, 其中, 各个特征代理主节点对各个第一本地存储库中的全量特征定时 生成全量特征快照, 各个第二应用节点初始化特征时通过特征代理SDK从各个特征代理主 节点下载全量特征快照并在各个第二本地存储库中构建全量特征, 所述第一本地存储库为 特征代理主节点的本地存 储库; S2, 根据调用方的应用调用请求, 确定所述远程模式业务应用集群和所述内嵌模式业 务应用集群中的一个作为目标业 务应用集群; S3, 当所述目标业务应用集群是所述远程模式业务应用集群时, 所述特征服务集群中 各个特征服务节点通过特征获取模块从特征存储库中获取第一特征, 并通过第一特征 处理 插件和第一特征算子执行模块对所述第一特征执行特征处理和特征算子运算, 输出符合特 征元数据定义的处 理结果; S4, 当所述目标业务应用集群是所述内嵌模式业务应用集群时, 所述内嵌模式业务应 用集群中各个第二应用节点通过特征代理SDK从各个第二本地存储库中获取第二特征, 并 通过第二特征处理插件和第二特征算子执行模块对所述第二特征执行特征处理和特征算 子运算, 输出符合特征元数据定义的处理结果, 其中, 所述第二本地存储库为第二应用节 点 的本地存 储库。 12.如权利要求11所述的方法, 其中, 所述初始化所述特征服务集群中的每个特征服务 节点, 包括: S11, 创建所述特 征服务节点与特 征存储库和特 征元数据库的连接;权 利 要 求 书 2/4 页 3 CN 113869530 B 3

.PDF文档 专利 一种机器学习在线特征生产系统和方法

文档预览
中文文档 18 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种机器学习在线特征生产系统和方法 第 1 页 专利 一种机器学习在线特征生产系统和方法 第 2 页 专利 一种机器学习在线特征生产系统和方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-19 01:20:18上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。