(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210430894.2
(22)申请日 2022.04.22
(71)申请人 海信电子科技(武汉)有限公司
地址 430073 湖北省武汉市东湖新 技术开
发区软件园东路1号软件产业4.1期B2
栋13层02号-2
(72)发明人 许畅 李俊彦
(74)专利代理 机构 北京弘权知识产权代理有限
公司 11363
专利代理师 逯长明 许伟群
(51)Int.Cl.
G06F 16/783(2019.01)
G06F 16/78(2019.01)
G06F 16/75(2019.01)
G06F 16/953(2019.01)G06F 40/186(2020.01)
G06F 40/205(2020.01)
G06F 40/258(2020.01)
G06F 40/30(2020.01)
(54)发明名称
一种智能设备与主题构建方法
(57)摘要
本申请提供了一种智能设备与主题构建方
法。 智能设备包括显示器和处理器。 当处理器接
收用户输入的搜索指令, 响应于所述搜索指令,
对所述搜索文本执行概念抽取, 得到候选概念集
合。 通过梯度增强分类器过滤所述候选概念集
合, 得到概括性概念, 对所述视频标题与所述概
括性概念执行概念匹配标记, 得到标记后的概念
实体对, 根据所述视频标题对应的主题类别和所
述概念实体对构建主题层级关系库, 基于所述主
题层级关系库控制所述显示器显示所述搜索文
本对应主题及概念下的推荐实体。 因此, 智 能设
备可以根据用户搜索 的内容和视频标题进行主
题构建, 从而理解用户的意图, 返回更符合用户
期望的结果, 同时提高检索相关性、 检索效率和
检索召回率。
权利要求书2页 说明书10页 附图6页
CN 114840711 A
2022.08.02
CN 114840711 A
1.一种智能设备, 其特 征在于, 包括:
显示器, 被 配置为显示用户界面;
处理器, 被配置为:
接收用户输入的搜索指令;
响应于所述搜索指令, 从所述搜索指令中解析搜索文本和视频标题, 所述搜索文本为
用户在搜索时输入的查询信息; 对所述搜索文本执 行概念抽取, 得到候选概念集 合;
通过梯度增强分类 器过滤所述候选概念集 合, 得到概 括性概念;
对所述视频 标题与所述 概括性概念执行概念匹配标记, 得到标记后的概念实体对;
根据所述视频 标题对应的主题类别和所述 概念实体对构建主题层级关系库;
基于所述主题层级关系库控制所述显示器显示所述搜索文本相关的实体。
2.根据权利要求1所述的智能设备, 其特 征在于, 所述处 理器进一 步被配置为:
在对所述搜索文本执行概念抽取, 得到候选概念集合的步骤中, 通过自抽样策略匹配
所述搜索文本, 得到第一 候选概念;
通过对齐策略将所述搜索文本和所述视频 标题对齐抽取, 得到第二 候选概念;
将所述第一候选概念和所述第 二候选概念作为序列 标注模型的训练数据集, 通过训练
后的所述序列标注模型抽取概念, 得到第三 候选概念;
将所述第一候选概念、 所述第二候选概念和所述第三候选概念集合, 得到所述候选概
念集合。
3.根据权利要求1所述的智能设备, 其特征在于, 所述概念实体对包括第 一概念实体对
和第二概念实体对, 所述处理器进一步被配置为: 在对所述视频标题与所述概括性概念执
行概念匹配标记, 得到标记后的概念实体对的步骤中, 抽取 所述视频 标题中的关键实体词;
对所述关键实体词与 所述概括性概念执行概念匹配, 若所述概括性概念存在与所述关
键实体词相匹配的概念, 则将匹配的概念标记为第四候选概念;
将所述第四候选概念与所述关键实体词组合构成第一 概念实体对;
若所述概括性概念不存在与 所述关键实体词匹配的概念, 则通过所述关键实体词的上
下文本生成相 近概念, 根据所述相 近概念与所述概括性概念执行概念匹配, 将匹配的概念
标记为第五候选概念;
将所述第五候选概念与所述关键实体词的上 下文本组合构成第二 概念实体对。
4.根据权利要求3所述的智能设备, 其特征在于, 所述处理器还被配置为: 在执行抽取
所述视频标题中的关键实体词的步骤中, 根据所述视频标题的词频、 词性和实体标签特征,
对所述视频 标题中的词进行排序, 得到第一序列;
在所述第一序列中提取 前预设数量个词, 得到第一组词;
通过用词向量表示所述第一组词, 得到第一组向量词;
通过对所述第一组向量词构造加权无向图, 得到所述第一组词的无向图;
根据所述无向图将所述第一组词进行重新 排序计算, 得到第二序列;
筛选出第二序列中余弦相似度大于第一设定阈值的词, 得到所述关键实体词。
5.根据权利要求3所述的智能设备, 其特征在于, 所述处理器还被配置为: 在执行根据
所述关键实体词与所述概括性概念执行概念匹配, 若 所述概括性概念存在与所述关键实体
词相匹配的概念, 则将匹配的概念标记为第四候选概念的步骤中, 获取用户日志, 所述用户权 利 要 求 书 1/2 页
2
CN 114840711 A
2日志中包括用户点击数量;
根据所述用户点击数量生成扩充文本集合, 所述扩充文本集合中包括按照用户点击数
量排序的标题;
根据所述扩充 文本集合扩充所述第四候选概念中的每一个概念, 得到扩充后的概念;
通过词向量计算所述扩充后的概念和所述视频 标题的余弦相似度;
若所述余弦相似度大于第二设定阈值, 则保留所述扩充后的概念;
若所述余弦相似度小于或等于所述第二设定阈值, 则不保留所述扩充后的概念。
6.根据权利要求5所述的智能设备, 其特征在于, 所述概念实体对还包括扩充后的概念
实体对, 所述处理器还被配置为: 根据所述用户点击数量生成扩充标题集合, 在所述扩充标
题集合中抽取关键实体词;
根据所述关键实体词与所述概括性概念执行概念匹配, 若所述概括性概念存在与 所述
关键实体词相匹配的概念, 则将匹配的概念标记为扩充后的第四候选概念;
若所述概括性概念不存在与 所述关键实体词匹配的概念, 则通过所述关键实体词的上
下文本生成与所述关键实体词相近的概念, 标记为扩充后的第五候选概念;
将所述扩充后的第四候选概念、 扩充后的第五候选概念和所述关键实体词组合构 成所
述扩充后的概念实体对。
7.根据权利要求3所述的智能设备, 其特征在于, 所述处理器还被配置为: 在执行若所
述概括性概念不存在与所述关键实体词匹配的概念, 则通过所述关键实体词的上下文本生
成相近概念, 根据所述相 近概念与所述概括性概念执行概念匹配, 将匹配的概念标记为第
五候选概念的步骤中, 计算所述第 五候选概念中的每个概念的所述视频标题、 所述关键实
体词和所述第五候选概念同时出现的概 率;
当概率大于第三设定阈值时, 保留所述第五候选概念;
当概率小于或等于所述第三设定阈值时, 则不保留所述第五候选概念。
8.根据权利要求1所述的智能设备, 其特征在于, 所述处理器还被配置为: 在执行根据
所述视频标题对应的主题类别和所述概念实体对构建主题层级关系库的步骤中, 根据文本
分类模型对所述视频 标题进行主题分类, 得到主题类别;
将所述主题类别与所述 概念实体对构建主题层级关系, 得到主题层级关系库。
9.根据权利要求8所述的智能设备, 其特 征在于, 所述处 理器还被 配置为:
通过所述主题层级关系库, 将所述视频 标题和所述搜索文本映射到同一语义空间。
10.一种主题构建方法, 其特征在于, 应用于智能设备, 所述智能设备包括显示器和处
理器, 所述方法包括:
接收用户输入的搜索指令;
响应于所述搜索指令, 从所述搜索指令中解析搜索文本和视频标题, 所述搜索文本为
用户在搜索时用户输入的查询信息;
根据所述搜索文本执 行概念抽取, 得到候选概念集 合;
通过采用梯度增强分类 器过滤所述候选概念集 合, 得到概 括性概念;
通过对所述视频标题与所述概括性概念执行概念匹配标记, 得到标记后的概念实体
对;
根据所述视频 标题对应的主题类别和所述 概念实体对构建主题层级关系库。权 利 要 求 书 2/2 页
3
CN 114840711 A
3
专利 一种智能设备与主题构建方法
文档预览
中文文档
19 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 17:46:45上传分享