(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210330902.6
(22)申请日 2022.03.30
(71)申请人 北京三快在线科技有限公司
地址 100080 北京市海淀区北四环西路9号
2106-030
(72)发明人 徐晓阳 李翔 秦佳妮 金艳婷
(74)专利代理 机构 北京三高永信知识产权代理
有限责任公司 1 1138
专利代理师 谢冬寒
(51)Int.Cl.
G06F 16/906(2019.01)
G06F 16/9032(2019.01)
G06F 40/247(2020.01)
G06F 40/284(2020.01)
G06F 40/30(2020.01)G06K 9/62(2022.01)
(54)发明名称
信息聚合方法、 装置、 设备及计算机可读存
储介质
(57)摘要
本申请公开了一种信息聚合方法、 装置、 设
备及计算机可读存储介质。 该方法包括: 获取待
聚合的至少一个初始内容和多个用户关注点信
息; 基于该多个用户关注点信息, 从该至少一个
初始内容中获取至少一条待聚合语句, 任一条待
聚合语句中包括用户关注的信息, 且 该任一条待
聚合语句中包括的用户关注的信息与该多个用
户关注点信息中的至少一个用户关注点信息匹
配; 将至少一条待聚合语句进行聚合, 基于聚合
结果得到 该至少一个初始内容的聚合内容。 该方
法通过获取包括与至少一个用户关注点信息匹
配的用户关注的信息的待聚合语句, 基于待聚合
语句获取至少一个初始内容的聚合内容, 使 得聚
合内容包括的用户关注点信息较为集中, 信息聚
合的有效性较高。
权利要求书3页 说明书15页 附图4页
CN 114791971 A
2022.07.26
CN 114791971 A
1.一种信息聚合方法, 其特 征在于, 所述方法包括:
获取待聚合的至少一个初始内容和多个用户关注点信息;
基于所述多个用户关注点信息, 从所述至少一个初始内容中获取至少一条待聚合语
句, 任一条待聚合语句中包括用户关注的信息, 且所述任一条待聚合语句中包括的用户关
注的信息与所述多个用户关注点信息中的至少一个用户关注点信息匹配;
将所述至少一条待聚合语句进行聚合, 基于聚合结果得到所述至少一个初始内容的聚
合内容。
2.根据权利要求1所述的方法, 其特征在于, 所述基于所述多个用户关注点信息, 从所
述至少一个初始内容中获取至少一条待聚合语句, 包括:
基于所述至少一个初始内容和所述多个用户关注点信息, 获取至少一条语句模板, 任
一条语句模板包括至少一个占位符, 一个占位符对应一个用户关注点信息;
将所述至少一条语句模板和与至少一个用户关注点信息匹配的用户关注的信息进行
组合, 得到所述至少一条待聚合语句。
3.根据权利要求2所述的方法, 其特征在于, 所述基于所述至少一个初始内容和所述多
个用户关注点信息, 获取至少一条语句模板, 包括:
基于所述多个用户关注点信息, 获取 所述多个用户关注点信息的同义信息;
将所述至少一个初始内容包括的语句与所述多个用户关注点信息和所述多个用户关
注点信息的同义信息进行匹配, 得到匹配成功的至少一条第一语句, 任一条第一语句包括
至少一个用户关注点信息, 和/或, 至少一个用户关注点信息的同义信息;
基于所述匹配成功的至少一条第一语句, 获取至少一条语句模板 。
4.根据权利要求3所述的方法, 其特征在于, 所述基于所述多个用户关注点信息, 获取
所述多个用户关注点信息的同义信息, 包括:
基于语义模型, 获取各个用户关注点信息的词向量, 以及所述至少一个初始内容包括
的多个词语的词向量;
根据所述各个用户关注点信 息的词向量与 所述多个词语的词向量的欧式距离, 获取所
述各个用户关注点信息的同义信息 。
5.根据权利要求3所述的方法, 其特征在于, 所述基于所述匹配成功的至少一条第 一语
句, 获取至少一条语句模板, 包括:
分别替换所述至少一条第 一语句中的各个用户关注点信 息, 和/或, 各个用户关注点信
息的同义信息为所述各个用户关注点信息对应的占位符, 得到 至少一条第二语句;
基于语义模型, 获取 各条第二语句的句向量;
基于所述各条第 二语句的句向量, 对所述至少一条第 二语句进行聚类, 得到聚类结果;
基于所述聚类结果, 获取至少一条语句模板 。
6.根据权利要求1所述的方法, 其特征在于, 所述基于所述多个用户关注点信息, 从所
述至少一个初始内容中获取至少一条待聚合语句, 包括:
基于所述多个用户关注点信息获取序列标注模型;
将所述至少一个初始内容输入所述序列 标注模型, 获取所述序列 标注模型输出的至少
一条待聚合语句。
7.根据权利要求1 ‑6中任一所述的方法, 其特征在于, 所述获取待聚合的至少一个初始权 利 要 求 书 1/3 页
2
CN 114791971 A
2内容和多个用户关注点信息之后, 还 包括:
基于图片标注模型标注各个初始内容包括的各个图片, 获取所述各个图片的图片信
息;
所述基于聚合结果得到所述至少一个初始内容的聚合内容, 包括:
将所述各个图片的图片信 息与所述多个用户关注点信 息进行匹配, 得到匹配成功的至
少一个第一图片, 所述第一图片的图片信息包括所述多个用户关注点信息中的至少一个用
户关注点信息;
将聚合结果和所述至少一个第 一图片进行组合, 得到所述至少一个初始内容的聚合内
容。
8.根据权利要求7所述的方法, 其特征在于, 所述聚合内容包括标题; 所述基于聚合结
果得到所述至少一个初始内容的聚合内容之后, 还 包括:
获取所述聚合内容包括的各个第一图片中的目标图片;
将所述目标图片与所述标题进行组合, 得到所述聚合内容的封面图片。
9.根据权利要求8所述的方法, 其特征在于, 所述获取所述 聚合内容包括的各个第 一图
片中的目标图片, 包括:
获取所述各个第一图片的图片比例;
将所述各个第一图片的图片比例与参 考比例进行匹配;
基于图片比例与所述 参考比例匹配成功的第一图片确定目标图片。
10.根据权利要求9所述的方法, 其特征在于, 所述各个第 一图片还包括质量评分, 所述
质量评分用于指示所述第一图片的质量; 所述基于图片比例与所述参考比例匹配成功的第
一图片确定目标图片, 包括:
响应于图片比例与 所述参考比例匹配成功的第 一图片的数量为多个, 根据图片比例与
所述参考比例匹配成功的多个第一图片的质量评分, 确定所述目标图片。
11.根据权利要求8 ‑10中任一所述的方法, 其特征在于, 所述将所述目标图片与所述标
题进行组合, 得到所述聚合内容的封面图片, 包括:
检测所述目标图片包括的关键信息的位置;
将所述标题叠加在所述目标图片上, 得到所述聚合内容的封面图片, 其中, 所述标题的
位置为所述目标图片上除所述关键信息的位置以外的其 他位置。
12.一种信息聚合装置, 其特 征在于, 所述装置包括:
第一获取模块, 用于获取待聚合的至少一个初始内容和多个用户关注点信息;
第二获取模块, 用于基于所述多个用户关注点信息, 从所述至少一个初始内容中获取
至少一条待聚合语句, 任一条待聚合语句中包括用户关注的信息, 且所述任一条待聚合语
句中包括的用户关注的信息与所述多个用户关注点信息中的至少一个用户关注点信息匹
配;
聚合模块, 用于将所述至少一条待聚合语句进行聚合, 基于聚合结果得到所述至少一
个初始内容的聚合内容。
13.一种计算机设备, 其特征在于, 所述计算机设备包括处理器和存储器, 所述存储器
中存储有至少一条程序代码, 所述至少一条程序代码由所述处理器加载并执行, 以使所述
计算机设备实现如权利要求1至1 1任一所述的信息聚合方法。权 利 要 求 书 2/3 页
3
CN 114791971 A
3
专利 信息聚合方法、装置、设备及计算机可读存储介质
文档预览
中文文档
23 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共23页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 17:48:10上传分享