安全公司报告
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211218000.X (22)申请日 2022.09.30 (71)申请人 腾讯音乐娱乐科技 (深圳) 有限公司 地址 518052 广东省深圳市前海深港合作 区前湾一路1号A栋201室 (入驻深圳市 前海商务秘书 有限公司) (72)发明人 蒋明明 徐晓波  (74)专利代理 机构 深圳市深佳知识产权代理事 务所(普通 合伙) 44285 专利代理师 张晓 (51)Int.Cl. G06F 16/2458(2019.01) G06F 16/21(2019.01) G06F 16/28(2019.01) (54)发明名称 数据波动归因分析方法、 系统及相关装置 (57)摘要 本申请实施例公开了数据波动归因分析方 法、 系统及相关装置, 该方法包括: 获取每一维度 的各子维度下参与统计的子维度当前数据, 获取 与目标统计数据采集时间不同的历史统计数据, 计算各维度的每一子维度下的子维度当前数据 分别对应的数据波动度量值, 根据数据波动度量 值从多维度中确定出根因维度。 考虑到某一子维 度当前数据可能会被同维度下的其他子维度共 享, 故本申请不仅能量化体 现各子维度层面的数 据变化, 还能反馈某一子维度当前数据受同维度 的其他子维度当前数据的影 响情况, 使得最终可 分析子维度之间的数据互斥或数据重叠场景, 从 而准确的推断出上层哪一维度为引起数据波动 的根因维度, 推进后续应用的进程。 权利要求书2页 说明书11页 附图5页 CN 115510129 A 2022.12.23 CN 115510129 A 1.一种数据波动归因分析 方法, 其特 征在于, 包括: 对于由多维度 数据汇总分析得的目标统计数据, 获取每一维度的各子维度下参与统计 的子维度当前数据, 其中, 至少 部分维度的子维度当前数据归属于同一维度下 的不同子维 度; 获取与所述目标统计数据采集时间不同的历史 统计数据; 对于所述多维度中的各维度, 根据所述目标统计数据和所述历史统计数据, 计算所述 维度的每一子维度下的子维度当前数据分别对应的数据波动度量值, 所述数据波动度量值 用于表示所述子维度当前数据在同维度的其他子维度当前数据的参与下相对历史统计数 据发生的数据变化; 根据算得的各所述数据波动度量值, 从所述多维度中确定出使得所述目标统计数据相 对于所述历史 统计数据发生超阈值波动的根因维度。 2.根据权利要求1所述的数据波动归因分析方法, 其特征在于, 若所述数据波动度量值 包括所述子维度当前数据对应的概率分布相似度和所述子维度当前数据对应的指标权重, 则计算所述维度的每一子维度下的子维度当前 数据分别对应的数据波动度量 值, 包括: 对于所述维度 下的每个子维度, 统计所述子维度 下的子维度当前数据 所指向的统计对 象, 因出现在同属维度的不同子维度中而得到的子维度经历量; 计算所述子维度 经历量相对于所述历史统计数据得到的先验概率, 及所述子维度 经历 量相对于所述目标统计数据得到的后验概率, 所述先验概率和所述后验概率用于表示所述 统计对象在不同采集时间的统计数据中的概 率分布; 计算所述先验概 率和所述后验概 率之间的所述 概率分布相似度; 将所述子维度对应的子维度当前数据, 更换成来自所述历史统计数据的同一子维度 下 对应的子维度历史数据; 根据更换得的所述子维度历史数据, 计算所述子维度当前数据相对于前后两次统计数 据变化量的所述指标权 重。 3.根据权利要求1或2所述的数据波动归因分析方法, 其特征在于, 若所述数据波动度 量值为包含概率分布相似度和指标权重的多类数据波动度量值, 则从所述多维度中确定出 根因维度, 包括: 对于每一维度, 判断所述维度下是否存在目标数目个, 各类数据波动度量值均大于相 应的数据波动阈值的子维度, 所述数据波动阈值包括 概率相似阈值和权 重阈值; 若存在, 确定所述维度为 根因维度。 4.根据权利要求1或2所述的数据波动归因分析方法, 其特征在于, 若确定得的所述根 因维度有 多个, 则所述方法还 包括: 对各所述根因维度对应的其中一类数据波动度量值进行降值排序, 并选取预设数目个 排序在先的所述 根因维度作为 最终的根因维度。 5.根据权利要求1或2所述的数据波动归因分析方法, 其特征在于, 若确定得的所述根 因维度有 多个, 则所述方法还 包括: 对每一所述根因维度对应的各类数据波动度量值进行融合处理, 得到各所述根因维度 分别对应的结果融合 值; 选取所述结果融合 值超过评 选阈值的预设数目个所述 根因维度作为 最终的根因维度。权 利 要 求 书 1/2 页 2 CN 115510129 A 26.根据权利要求1所述的数据波动归因分析方法, 其特征在于, 获取每一维度的各子维 度下参与统计的子维度当前 数据之前, 所述方法还 包括: 对于所述多维度中的每一维度, 若所述维度下的各子维度之间满足互斥关系, 则将所 述维度作为只含互斥子维度的维度, 且所述数据波动度量值包括子维度当前数据对应的数 据差值; 所述互斥关系表示同一维度下的各子维度当前 数据均仅归属于其中一个子维度; 计算所述维度的每一子维度下的子维度当前 数据分别对应的数据波动度量 值, 包括: 对于只含互斥子维度的维度, 计算所述维度对应的维度当前数据相对于, 来自所述历 史统计数据的同一维度下的维度当前 数据产生的所述数据差值。 7.根据权利要求1所述的数据波动归因分析方法, 其特征在于, 获取每一维度的各子维 度下参与统计的子维度当前 数据之前, 所述方法还 包括: 若目标统计数据相对于历史统计数据的数据波动超过预设波动范围, 则将所述目标统 计数据作为触发定时归因分析的统计数据, 并在所述目标统计数据开始定时归因分析之 前, 通过数据调度平台查询所述目标统计数据是否 完成收集; 若未完成, 通过 所述数据调度平台从数据源继续收集数据, 直至收集完成。 8.一种数据波动归因分析系统, 其特 征在于, 包括: 获取 单元、 计算单 元和确定单元; 对于由多维度数据汇总分析得的目标统计数据, 所述获取单元用于, 获取每一维度的 各子维度下参与统计的子维度当前数据, 其中, 至少 部分维度的子维度当前数据归属于同 一维度下的不同子维度; 所述获取 单元还用于, 获取与所述目标统计数据采集时间不同的历史 统计数据; 对于所述多维度中的各维度, 所述计算单元用于, 根据所述目标统计数据和所述历史 统计数据, 计算所述维度的每一子维度下 的子维度当前数据分别对应的数据波动度量值, 所述数据波动度量值用于表示所述子维度当前数据在同维度的其他子维度当前数据的参 与下相对历史 统计数据发生的数据变化; 所述确定单元用于, 根据算得的各所述数据波动度量值, 从所述多维度中确定出使得 所述目标统计数据相对于所述历史 统计数据发生超阈值波动的根因维度。 9.一种数据波动归因分析装置, 其特 征在于, 包括: 中央处理器, 存储器以及输入输出接口; 所述存储器为短暂存 储存储器或持久存储存储器; 所述中央处理器配置为与 所述存储器通信, 并执行所述存储器中的指令操作以执行权 利要求1至7中任意 一项所述的方法。 10.一种计算机可读存储介质, 其特征在于, 包括指令, 当所述指令在计算机上运行时, 使得计算机执 行如权利要求1至7中任意 一项所述的方法。权 利 要 求 书 2/2 页 3 CN 115510129 A 3

PDF文档 专利 数据波动归因分析方法、系统及相关装置

文档预览
中文文档 19 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 数据波动归因分析方法、系统及相关装置 第 1 页 专利 数据波动归因分析方法、系统及相关装置 第 2 页 专利 数据波动归因分析方法、系统及相关装置 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:34:07上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。