(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211084035.9
(22)申请日 2022.09.06
(71)申请人 连通 (杭州) 技 术服务有限公司
地址 310052 浙江省杭州市滨江区长河街
道越达巷79号1幢801室
(72)发明人 向桥梁 张俊龙 唐钦崎 周雯晶
(74)专利代理 机构 上海百一领御专利代理事务
所(普通合伙) 31243
专利代理师 甘章乖
(51)Int.Cl.
G06Q 20/38(2012.01)
G06Q 40/04(2012.01)
G06F 16/2458(2019.01)
(54)发明名称
一种交易报文的异常原因排 查方法与设备
(57)摘要
本申请的目的是提供一种交易报文的异常
原因排查方法与设备。 与现有技术相比, 本申请
通过从所述交易报文的各个字段中筛选出多个
字段作为异常维度; 根据所述异常维度及所述交
易报文确定异常排查组合, 其中, 所述异常排查
组合包含若干个异常维度; 根据所述异常排查组
合对所述交易报文进行排查, 确定异常原因。 该
方式对交易报文字段的筛选及异常维度组合操
作, 既能实现较高的异常排查速度, 同时能满足
异常排查对质量的要求。
权利要求书3页 说明书10页 附图1页
CN 115439120 A
2022.12.06
CN 115439120 A
1.一种交易报文的异常原因排 查方法, 其中, 所述方法包括:
从所述交易报文的各个字段中筛 选出多个字段作为异常维度;
根据所述异常维度及所述交易报文确定异常排查组合, 其中, 所述异常排查组合包含
若干个异常维度;
根据所述异常排 查组合对所述交易报文 进行排查, 确定异常原因。
2.根据权利要求1所述的方法, 预设单维量化指标及对应 阈值, 所述从所述交易报文的
各个字段中筛 选出多个字段作为异常维度包括:
根据所述单维量化指标及对应阈值筛选出所述交易报文的各个字段中的多个作为异
常维度;
其中, 所述单维量 化指标包括 缺失率、 离 散度及信息量中的至少任一项;
其中, 所述 缺失率为字段内容 为空的交易报文在所有交易报文中的占比;
所述离散程度为字段的特征值总数在所有交易报文中的占比, 其中, 所述特征值为该
字段的不同内容;
所述信息量 为1与该字段 经归一化的信息熵的差值。
3.根据权利要求2所述的方法, 其中, 预设组合量化指标及组合阈值, 所述根据所述异
常维度及所述交易报文确定异常排查组合, 其中, 所述异常排查组合包含若干个异常维度
包括:
根据所述异常维度对若干个基础维度分别进行升维组合, 以生成包含所述基础维度的
异常维度组合, 其中, 所述基础维度初始为所述异常维度;
根据所述交易报文及所述组合量化指标对该异常维度组合进行组合量化指标值的计
算;
根据所述组合量化指标值判断该异常维度组合是否符合预设评估规则, 若符合, 则将
该异常维度组合更新 为所述基础维度重复上述操作; 否则,
若评估结果 不符合组合阈值, 则将所述基础维度作为异常排 查组合。
4.根据权利要求3所述的方法, 其中, 预设滑动 窗口大小, 所述从所述交易报文的各个
字段中筛 选出多个字段作为异常维度之后还 包括:
将所有所述异常维度组成异常维度 序列;
其中, 所述 根据所述异常维度对若干个 基础维度分别进行升维组合包括:
将所述基础维度的各个异常维度中在所述异常纬度序列内排序最后的异常维度作为
该基础维度的升维标记;
将所述异常维度序列中位于该升维标记之后的滑动 窗口大小范围内的异常维度分别
加入到所述基础维度中, 以生成该基础维度对应的若干个异常维度组合。
5.根据权利要求4所述的方法, 其中, 所述将所有所述异常维度组成异常维度序列包
括:
将所有所述异常维度按照所述单维量 化指标的降序排序形成异常维度 序列。
6.根据权利要求3至5中任一项所述的方法, 其中, 所述根据所述交易报文及所述组合
量化指标对该异常维度组合进行组合 量化指标值的计算包括:
根据所述交易报文确定所述异常维度组合中各个异常维度的全部特征值及其出现次
数, 其中, 所述特 征值为所述交易报文中该异常维度对应字段的不同内容;权 利 要 求 书 1/3 页
2
CN 115439120 A
2根据所述异常维度组合中各个异常维度的所述特征值及其出现次数对所述交易报文
进行数据划分;
根据所述组合 量化指标及数据划分结果进行组合 量化指标值的计算。
7.根据权利要求5所述的方法, 其中, 所述根据所述异常维度组合中各个异常维度的所
述特征值及其出现次数对所述交易报文 进行数据划分包括:
将各个异常维度的出现次数超过 预设阈值的特 征值作为该异常维度的划分标记;
顺序遍历所述异常维度组合中的各个异常维度, 根据遍历到的异常维度的所述划分标
记将所述交易报文划分为一个或多个第一数据集及一个第二数据集, 其中, 所述第一数据
集为包含某一个划分标记的交易报文集合, 所述第二数据集为不包含任何划分标记的交易
报文集合;
根据遍历到的下一个异常维度的所述划分标记对所述第一数据集及第二数据集重复
上述操作, 使得每个第一数据集及第二数据集都划分为一个或多个第一数据集及一个第二
数据集;
重复上述划分操作, 直至所述异常维度组合遍历完毕。
8.根据权利要求7所述的方法, 其中, 所述组合量化指标包括高频覆盖率及组合信息
量, 根据所述组合 量化指标及数据划分结果进行组合 量化指标值的计算包括:
将所述异常维度组合中最后一个异常维度对应的所有第一数据集的交易报文数量在
全部交易报文中的占比作为所述高频覆盖率;
根据异常维度组合中最后两个异常维度对应的第一数据集及第二数据集确定的信息
熵生成所述组合信息量。
9.根据权利要求8所述的方法, 其中, 所述根据异常维度组合中最后两个异常维度对应
的第一数据集及第二数据集确定的信息熵生成所述组合信息量包括:
计算所述异常维度组合中倒数第二个异常维度对应的所有第一数据集及第二数据集
中的交易报文数量在全部交易报文中的占比, 将其作为第一覆盖率;
对于倒数第 二个异常维度对应的各个第 一数据集及第 二数据集, 计算由最后一个异常
维度对该数据集划分产生的所有第一数据集及第二数据集中的交易报文数量在该数据集
交易报文中的占比, 将该占比作为第二覆盖率;
根据所述第二覆盖率计算倒数第二个异常维度对应的各个第一数据集及第二数据集
的信息熵并对所述信息熵进行归一 化处理;
将1与归一化信 息熵的差值作为倒数第 二个异常维度对应的各个第 一数据集及第 二数
据集的信息量;
将倒数第二个异常维度对应的各个第一数据集及第二数据集的信息量与其第一覆盖
率的乘积进行求和, 得到该异常维度组合的组合信息量。
10.根据权利要求9所述的方法, 其中, 可采用多叉树形式进行数据划分, 即将所有交易
报文作为根节点, 将按照异常维度组合中的第一个异常维度划分出的第一数据集及第二数
据集作为第一层子节点, 以此类推, 最后一个异常维度划分出的第一数据集及第二数据集
作为叶节点。
11.根据权利要求8至10中任一项所述的方法, 其中, 所述预设评估规则包括提升阈值,
所述根据所述组合 量化指标值判断该异常维度组合是否符合预设评估规则包括:权 利 要 求 书 2/3 页
3
CN 115439120 A
3
专利 一种交易报文的异常原因排查方法与设备
文档预览
中文文档
15 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:34:15上传分享