(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211070500.3
(22)申请日 2022.09.02
(71)申请人 中国银行股份有限公司
地址 100818 北京市西城区复兴门内大街1
号
(72)发明人 陶芳娜 文国军 张家星 张漫漫
王家礼 葛洋洋 金鸣
(74)专利代理 机构 北京集佳知识产权代理有限
公司 11227
专利代理师 丁曼曼
(51)Int.Cl.
G06Q 40/02(2012.01)
G06N 20/00(2019.01)
G06K 9/62(2022.01)
(54)发明名称
一种授信数据的确定方法、 装置及电子设备
(57)摘要
本申请公开了一种授信数据的确定方法、 装
置及电子设备, 可应用于人工智能领域或金融领
域。 获取授信基础数据, 并对授信基础数据进行
数据预处理操作, 得到目标基础数据, 将目标基
础数据输入 预先生成的授信数据分析模型中, 得
到授信分析结果。 本发明中的授信数据分析模型
基于训练得到, 并且在训练后的测试过程中, 若
是授信测试样本的实际授信分析结果与参考授
信分析结果不同时, 会增大授信测试数据样本属
于参考授信分析结果的条件概率, 降低授信测试
数据样本属于实际授信分析结果的条件概率, 并
对模型进行再训练, 使 得训练得到的模型的精度
较高。 则使用该模型进行授信分析时, 得到的授
信分析结果的准确度也会较高, 能够满足企业授
信分析需求。
权利要求书3页 说明书10页 附图3页
CN 115409607 A
2022.11.29
CN 115409607 A
1.一种授信数据的确定方法, 其特 征在于, 包括:
获取授信基础数据, 并对所述授信基础数据进行 数据预处 理操作, 得到目标基础数据;
将所述目标基础数据输入预先生成的授信数据分析模型中, 得到授信分析结果; 所述
授信数据分析模型的训练过程包括:
获取授信训练样本和授信测试样本, 所述授信训练样本包括授信训练数据样本以及所
述授信训练数据样本对应的参考授信分析结果; 所述授信测试样本包括授信测试数据样本
以及所述授信测试 数据样本对应的参 考授信分析 结果;
基于所述授信训练样本, 对朴素贝叶斯模型进行训练, 得到初始 授信数据分析模型;
调用所述初始授信数据分析模型对所述授信测试数据样本进行分析, 得到所述授信测
试数据样本的实际授信分析 结果;
在所述授信测试数据样本的实际授信分析结果与参考授信分析结果不同的情况下, 增
大所述授信测试数据样 本属于所述参考授信分析结果的条件概率, 以及降低所述授信测试
数据样本属于所述实际授信分析 结果的条件概 率;
至少基于所述授信测试数据样本属于所述参考授信分析结果的条件概率和属于所述
实际授信 分析结果的条件概率, 对所述初始授信数据分析模型进行迭代训练, 得到授信数
据分析模型。
2.根据权利要求1所述的确定方法, 其特征在于, 对所述授信 基础数据进行数据 预处理
操作, 得到目标基础数据, 包括:
确定出所述授信基础数据中的属性的缺失值;
基于所述授信基础数据中的属性的非缺失值的众数或均值, 对所述缺失值进行填充操
作;
对所述授信基础数据中的属性的数值型 数据进行离 散化操作, 得到目标基础数据。
3.根据权利要求1所述的确定方法, 其特征在于, 基于所述授信训练样本, 对朴素贝叶
斯模型进行训练, 得到初始 授信数据分析模型, 包括:
计算所述授信训练数据样本的先验概 率和条件概 率;
基于所述授信训练数据样本的先验概率、 条件概率和参考授信分析结果, 对朴素贝叶
斯模型进行训练, 得到初始 授信数据分析模型。
4.根据权利要求1所述的确定方法, 其特征在于, 增大所述授信测试数据样本属于所述
参考授信分析结果的条件概率, 以及降低所述授信测试数据样本属于所述实际授信分析结
果的条件概 率, 包括:
获取条件概率调整公式; 所述条件概率调整公式包括第 一条件概率调整公式和第 二条
件概率调整公式; 所述第一条件概率调整公式用于计算所述授信测试数据样本属于所述参
考授信分析结果的增大后的条件概率; 所述第二条件概率调整公式用于计算所述授信测试
数据样本属于所述实际授信分析 结果的减少后的条件概 率;
根据所述第 一条件概率调 整公式, 计算所述授信测试数据样本属于所述参考授信分析
结果的增大后的条件概 率;
根据所述第 二条件概率调 整公式, 计算所述授信测试数据样本属于所述实际授信分析
结果的减少后的条件概 率。
5.根据权利要求1所述的确定方法, 其特征在于, 至少基于所述授信测试数据样本属于权 利 要 求 书 1/3 页
2
CN 115409607 A
2所述参考授信分析结果的条件概率和属于所述实际授信分析结果的条件概率, 对所述初始
授信数据分析模型进行迭代训练, 得到授信数据分析模型, 包括:
至少基于所述授信测试数据样本属于所述参考授信分析结果的条件概率和属于所述
实际授信 分析结果的条件概率, 对所述初始授信数据分析模型进行迭代训练, 并在迭代训
练过程中, 将训练得到的分类精度最大的初始 授信数据分析模型, 作为授信数据分析模型。
6.一种授信数据的确定装置, 其特 征在于, 包括:
数据处理模块, 用于获取授信基础数据, 并对所述授信 基础数据进行数据 预处理操作,
得到目标基础数据;
授信分析模块, 用于将所述目标基础数据输入预先生成的授信数据分析模型中, 得到
授信分析 结果; 所述授信数据分析模型为模型训练模块 生成;
所述模型训练模块包括:
样本获取子模块, 用于获取授信训练样本和授信测试样本, 所述授信训练样本包括授
信训练数据样本以及所述授信训练数据样本对应的参考授信分析结果; 所述授信测试样本
包括授信测试 数据样本以及所述授信测试 数据样本对应的参 考授信分析 结果;
第一训练子模块, 用于基于所述授信训练样本, 对朴素贝叶斯模型进行训练, 得到初始
授信数据分析模型;
结果分析子模块, 用于调用所述初始授信数据分析模型对所述授信测试数据样本进行
分析, 得到所述授信测试 数据样本的实际授信分析 结果;
概率调整子模块, 用于在所述授信测试数据样本的实际授信分析结果与参考授信分析
结果不同的情况下, 增大所述授信测试数据样本属于所述参考授信 分析结果的条件概率,
以及降低所述授信测试 数据样本属于所述实际授信分析 结果的条件概 率;
第二训练子模块, 用于至少基于所述授信测试数据样本属于所述参考授信分析结果的
条件概率和属于所述 实际授信分析结果的条件概率, 对所述初始授信数据分析模型进 行迭
代训练, 得到授信数据分析模型。
7.根据权利要求6所述的确定装置, 其特 征在于, 所述数据处 理模块包括:
缺失值确定 子模块, 用于确定出 所述授信基础数据中的属性的缺失值;
缺失值填充子模块, 用于基于所述授信基础数据中的属性的非缺失值的众数或均值,
对所述缺失值进行填充操作;
离散化操作子模块, 用于对所述授信基础数据中的属性的数值型数据进行离散化操
作, 得到目标基础数据。
8.根据权利要求1所述的确定装置, 其特 征在于, 所述第一训练子模块具体用于:
计算所述授信训练数据样本的先验概率和条件概率, 基于所述授信训练数据样本的先
验概率、 条件概率和参考授信分析结果, 对朴素贝叶斯模型进 行训练, 得到初始授信数据分
析模型。
9.根据权利要求1所述的确定装置, 其特 征在于, 所述 概率调整子模块包括:
公式获取单元, 用于获取条件概率调整公式; 所述条件概率调整公式包括第一条件概
率调整公式和 第二条件概率调整公式; 所述第一条件概率调整公式用于计算所述授信测试
数据样本属于所述参考授信分析结果的增大后的条件概率; 所述第二条件概率调整公式用
于计算所述授信测试 数据样本属于所述实际授信分析 结果的减少后的条件概 率;权 利 要 求 书 2/3 页
3
CN 115409607 A
3
专利 一种授信数据的确定方法、装置及电子设备
文档预览
中文文档
17 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-03-03 12:07:05上传分享