(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210505213.4
(22)申请日 2022.05.10
(71)申请人 中国平安财产保险股份有限公司
地址 518000 广东省深圳市福田街道益田
路5033号平安金融中心12、 13、 38、 39、
40、 62层
(72)发明人 康莉
(74)专利代理 机构 深圳市沃德知识产权代理事
务所(普通 合伙) 44347
专利代理师 高杰 于志光
(51)Int.Cl.
G06F 16/9535(2019.01)
G06F 16/33(2019.01)
G06F 40/216(2020.01)
G06F 40/289(2020.01)G06F 40/30(2020.01)
G06N 3/04(2006.01)
(54)发明名称
基于用户画像的新闻推荐方法、 装置、 设备
及存储介质
(57)摘要
本发明涉及人工智能技术, 揭露一种基于用
户画像的新闻推荐方法, 包括: 根据用户数据构
建用户画像; 提取新闻数据中的关键词, 将关键
词与新闻数据拼接得到新闻词条, 其中, 新闻数
据包括用户历史新闻和候选新闻; 对新闻词条进
行编码, 得到用户历史新闻对应的历史新闻 向量
和候选新闻对应的候选新闻向量; 利用第一注意
力模型将历史新闻向量编码为第一新闻偏向向
量; 利用第二注意力模型将第一新闻偏向向量和
候选新闻向量编码为第二新闻偏向向量; 根据第
二新闻偏向向量、 候选新闻向量和用户画像计算
用户对候选新闻的偏好程度, 按照偏好程度对用
户进行新闻推荐。 本发明还提出一种基于用户画
像的新闻推荐装置、 设备及介质。 本发明可以提
高新闻推荐精确度。
权利要求书2页 说明书10页 附图3页
CN 114741608 A
2022.07.12
CN 114741608 A
1.一种基于用户画像的新闻推荐方法, 其特 征在于, 所述方法包括:
获取新闻数据和用户数据, 并根据用户数据构建用户画像, 其中, 所述新闻数据包括用
户历史新闻和候选新闻;
提取所述新闻数据中的关键词, 并将所述关键词与所述新闻数据进行拼接, 得到新闻
词条;
对所述新闻词条进行编码, 得到所述用户历史新闻对应的历史新闻向量和所述候选新
闻对应的候选新闻向量;
利用预设的第一注意力模型将所述历史新闻向量编码为第一 新闻偏向 向量;
利用预设的第二注意力模型将所述第一新闻偏向向量和所述候选新闻向量编码为第
二新闻偏向 向量;
根据所述第 二新闻偏向向量、 所述候选新闻向量和所述用户画像计算用户对所述候选
新闻的偏好 程度, 并按照所述偏好 程度对用户进行新闻推荐。
2.如权利要求1所述的基于用户画像的新闻推荐方法, 其特征在于, 所述根据用户数据
构建用户画像, 包括:
对所述用户数据进行语义分析, 生成多个 语义特征;
从所述多个 语义特征中逐个选取其中一个特 征为目标 特征;
对所述目标 特征进行向量 转换, 得到目标 特征的特征向量;
将每一个 语义特征的特征向量进行向量 拼接, 得到用户画像。
3.如权利要求1所述的基于用户画像的新闻推荐方法, 其特征在于, 所述提取所述新闻
数据中的关键词, 包括:
对所述新闻数据进行分词处 理, 得到新闻分词;
对所述新闻分词进行词频统计, 选取词频统计大于预设阈值的新闻分词作为 候选词;
根据所述 候选词在预设的词频统计表中提取对应的词频值;
根据所述词频值对所述候选词设置权重, 并选取所述权重大于预设阈值的候选词为关
键词。
4.如权利要求1所述的基于用户画像的新闻推荐方法, 其特征在于, 所述将所述关键词
与所述新闻数据进行拼接, 得到新闻词条, 包括:
提取所述新闻数据中的新闻标题;
将所述新闻标题与所述关键词进行字段拼接;
判断拼接后的字段长度是否小于或等于预设阈值;
当拼接后的字段长度大于预设阈值时, 将拼接后的字段截取至预设长度, 并将截取后
的字段作为 新闻词条;
当拼接后的字段长度小于或等于预设阈值时, 将拼接后的字段作为 新闻词条。
5.如权利要求1所述的基于用户画像的新闻推荐方法, 其特征在于, 所述利用预设的第
一注意力模型将所述历史新闻向量编码为第一 新闻偏向 向量, 包括:
根据预设的权 重集合对所述历史新闻向量进行计算, 得到多个 基础向量;
对所述多个基础向量进行N 次线性变换, 并分别将N 次线性变换后的结果输入所述第一
注意力模型中的注意力网络中进行注意力编码, 得到多个输出 结果;
将所述输出 结果进行拼接, 并对拼接后的结果进行线性变换, 得到第一 新闻偏向 向量。权 利 要 求 书 1/2 页
2
CN 114741608 A
26.如权利要求1所述的基于用户画像的新闻推荐方法, 其特征在于, 所述利用预设的第
二注意力模型将所述第一新闻偏向向量和所述候选新闻向量编 码为第二新闻偏向向量, 包
括:
利用所述第二注意力模型中的双 向LSTM网络对所述第一新闻偏向向量和所述候选新
闻向量进行 前向编码和后向编码;
将前向编码和后向编码的结果进行拼接, 得到拼接向量;
利用所述第 二注意力模型中的嵌入单向LSTM的注意力网络对所述拼接向量进行解码,
得到第二 新闻偏向 向量。
7.如权利要求1至6中任一项所述的基于用户画像的新闻推荐方法, 其特征在于, 所述
根据所述第二新闻偏向向量、 所述候选新闻向量和所述用户画像计算用户对所述候选新闻
的偏好程度, 包括:
对所述根据所述第二新闻偏向向量、 所述候选新闻向量和所述用户画像进行卷积, 得
到联合向量;
将所述联合向量进行 预设次数的全连接处 理, 得到全连接向量;
并利用预设的激活函数对所述全连接向量进行计算, 得到的候选新闻的预测概 率。
8.一种基于用户画像的新闻推荐装置, 其特 征在于, 所述装置包括:
用户画像构建模块, 用于获取新闻数据和用户数据, 并根据用户数据构建用户画像, 其
中, 所述新闻数据包括用户历史新闻和候选新闻;
新闻词条生成模块, 用于提取所述新闻数据中的关键词, 并将所述关键词与所述新闻
数据进行拼接, 得到新闻词条;
向量编码模块, 用于对所述新闻词条进行编码, 得到所述用户历史新闻对应的历史新
闻向量和所述候选新闻对应的候选新闻向量; 利用预设的第一注意力模型将所述历史新闻
向量编码为第一新闻偏向向量; 利用预设的第二注意力模型将所述第一新闻偏向向量和所
述候选新闻向量编码为第二 新闻偏向 向量;
新闻推荐模块, 用于根据所述第二新闻偏向向量、 所述候选新闻向量和所述用户画像
计算用户对所述 候选新闻的偏好 程度, 并按照所述偏好 程度对用户进行新闻推荐。
9.一种电子设备, 其特 征在于, 所述电子设备包括:
至少一个处 理器; 以及,
与所述至少一个处 理器通信连接的存 储器; 其中,
所述存储器存储有可被所述至少一个处理器执行的计算机程序, 所述计算机程序被所
述至少一个处理器执行, 以使 所述至少一个处理器能够执行如权利要求 1至7中任意一项 所
述的基于用户画像的新闻推荐方法。
10.一种计算机可读存储介质, 存储有计算机程序, 其特征在于, 所述计算机程序被处
理器执行时实现如权利要求1至7中任意 一项所述的基于用户画像的新闻推荐方法。权 利 要 求 书 2/2 页
3
CN 114741608 A
3
专利 基于用户画像的新闻推荐方法、装置、设备及存储介质
文档预览
中文文档
16 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 17:49:38上传分享