安全公司报告
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210433270.6 (22)申请日 2022.04.24 (71)申请人 中国科学院空天信息创新研究院 地址 100190 北京市海淀区北四环西路19 号 (72)发明人 金力 李晓宇 张泽群 刘庆  张林浩 李树超  (74)专利代理 机构 中科专利商标代理有限责任 公司 11021 专利代理师 樊晓 (51)Int.Cl. G06F 16/33(2019.01) G06F 16/35(2019.01) G06F 40/289(2020.01) G06F 40/30(2020.01)G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 文本的情感倾向性分析方法、 装置、 设备及 介质 (57)摘要 本公开提供了一种文本的情感倾向性分析 方法, 包括: 从待分析文本中分别提取语义特征、 词性特征 以及共现词特征, 其中, 待分析文本包 括文本内容和与文本内容相关联的评论内容; 将 语义特征、 词性特征 以及共现词特征拼接, 得到 拼接特征; 对拼接特征进行预处理, 得到待分析 文本中的词序列特征; 对待分析文本中的词序列 特征进行聚合, 得到待分析文本的句子向量; 以 及将句子向量输入情感倾向性分析模 型, 输出待 分析文本的情感倾向性分析结果。 本公开还提供 了一种文本的情感倾向性分析装置、 设备、 存储 介质和程序 产品。 权利要求书2页 说明书13页 附图6页 CN 114691836 A 2022.07.01 CN 114691836 A 1.一种文本的情感倾向性分析 方法, 包括: 从待分析文本 中分别提取语义特征、 词性特征以及共现词特征, 其中, 所述待分析文本 包括文本内容和与所述文本内容相关联的评论内容; 将所述语义特 征、 所述词性特 征以及所述共现词特 征拼接, 得到拼接特 征; 对所述拼接特征进行预处理, 得到所述待分析文本中的词序列特 征; 对所述待分析文本中的词序列特 征进行聚合, 得到所述待分析文本的句子向量; 以及 将所述句子向量输入情感倾向性分析模型, 输出所述待分析文本的情感倾向性分析结 果。 2.根据权利要求1中所述的方法, 其中, 所述对所述拼接特征进行预处理, 得到所述待 分析文本中的词序列特 征包括: 对所述拼接特征进行线性激活转换, 生成线性激活的特 征; 对所述拼接特征进行非线性激活转换, 生成非线性激活的特 征; 基于所述 拼接特征, 利用注意力机制得到 权重向量; 根据所述权重向量, 对所述线性激活的特征和所述非线性激活的特征进行组合, 得到 所述待分析文本中的词序列特 征。 3.根据权利要求2中所述的方法, 其中, 所述基于所述拼接特征, 利用注意力机制得到 权重向量包括: 根据不同 映射矩阵, 将所述 拼接特征转换为 查询向量、 键向量以及值向量; 利用所述注意力机制, 获得 具有不同权 重值的拼接特 征; 将所述具有不同权重值的拼接特征通过前向传播层进行降维, 得到降维后的具有不同 权重值的拼接特 征; 将所述降维后的具有不同权 重值的拼接特 征通过非线性激活函数生成所述权 重向量。 4.根据权利要求1中所述的方法, 其中, 所述对所述待分析文本中的词序列 特征进行聚 合, 得到所述待分析文本的句子向量包括: 将所述待分析文本中的词序列特 征输入门控循环单 元; 输出所述待分析文本的句子向量。 5.根据权利要求1中所述的方法, 其中, 所述从待分析文本中分别提取语义特征、 词性 特征以及共现词特 征包括: 将所述待分析文本 输入预训练语言表征模型, 输出 所述语义特 征; 对所述文本内容和所述评论内容中共同出现的词进行嵌入表示, 得到所述共现词特 征; 将所述待分析文本中每 个词的词性进行嵌入表示, 得到所述词性特 征。 6.根据权利要求1中所述的方法, 其中, 所述情感倾向性分析模型通过预先训练得到; 所述预先训练的方法包括: 从训练样本 中分别提取样本语义特征、 样本词性特征以及样本共现词特征, 其中, 所述 训练样本包括: 文本内容样本、 与所述文本内容样本相关联的评论内容样本以及情感标签; 将所述样本语义特征、 所述样本词性特征以及所述样本共现词特征拼接, 得到样本拼 接特征; 对所述样本拼接特 征进行预处理, 得到所述训练样本中的样本词序列特 征;权 利 要 求 书 1/2 页 2 CN 114691836 A 2对所述训练样本中的样本词序列特 征进行聚合, 得到所述训练样本的样本句子向量; 将所述样本句子向量输入分类模型, 输出 所述训练样本的情感倾向性分类结果; 基于所述情感倾向性分类结果和所述情感标签, 调整所述分类模型的参数, 将训练后 的分类模型作为所述情感倾向性分析模型。 7.一种文本的情感倾向性分析装置, 包括: 特征提取模块, 用于从待分析文本 中分别提取语义特征、 词性特征以及共现词特征, 其 中, 所述待分析文本包括文本内容和与所述文本内容相关联的评论内容; 特征拼接模块, 用于将所述语义特征、 所述词性特征以及所述共现词特征拼接, 得到拼 接特征; 预处理模块, 用于对所述 拼接特征进行预处理, 得到所述待分析文本中的词序列特 征; 聚合模块, 用于对所述待分析文本中的词序列特征进行聚合, 得到所述待分析文本的 句子向量; 以及 分析模块, 用于将所述句子向量输入情感倾向性分析模型, 输出所述待分析文本的情 感倾向性分析 结果。 8.一种电子设备, 包括: 一个或多个处 理器; 存储装置, 用于存 储一个或多个程序, 其中, 当所述一个或多个程序被所述一个或多个处理器执行时, 使得所述一个或多个 处理器执行根据权利要求1~6中任一项所述的方法。 9.一种计算机可读存储介质, 其上存储有可执行指令, 该指令被处理器执行时使处理 器执行根据权利要求1~6中任一项所述的方法。 10.一种计算机程序产品, 包括计算机程序, 所述计算机程序被处理器执行时实现根据 权利要求1~6中任一项所述的方法。权 利 要 求 书 2/2 页 3 CN 114691836 A 3

.PDF文档 专利 文本的情感倾向性分析方法、装置、设备及介质

文档预览
中文文档 22 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共22页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 文本的情感倾向性分析方法、装置、设备及介质 第 1 页 专利 文本的情感倾向性分析方法、装置、设备及介质 第 2 页 专利 文本的情感倾向性分析方法、装置、设备及介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 17:51:10上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。