(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210200075.9
(22)申请日 2022.03.02
(71)申请人 广东司法警官职业学院
地址 510520 广东省广州市天河区龙腾路
245号
(72)发明人 许学添 邹同浩 肖枫 谢文俊
(74)专利代理 机构 深圳市圳博友 邦专利代理事
务所(普通 合伙) 44600
专利代理师 王芬思
(51)Int.Cl.
G06F 16/35(2019.01)
G06F 40/289(2020.01)
G06F 40/30(2020.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)
(54)发明名称
一种文本情感分析方法
(57)摘要
本发明涉及一种文本情感分析方法, 包括以
下步骤: S1: 将文本句子中的词语转为词向量;
S2: 将词向量映射为情感特征向量; S3: 将词向量
和情感特征向量拼接为每个词的情感特征词向
量, 整个句子中多个情感特征词向量一起作为输
入特征矩阵; S4: 将输入特征矩阵输入卷积神经
网络进行训练, 获取第一抽象情感特征; S5: 将输
入特征矩阵输入双向长短期记忆网络进行训练,
获取第二抽象情感特征; S6: 将第一抽象情感特
征和第二抽象情感特征进行融合拼接, 再输入全
连接神经网络, 最后通过Softmax层输出句子的
情感分类。 相对于现有技术, 本发明的文本情感
分析方法可以快速, 准确地实现文本的智能情感
分类识别。
权利要求书1页 说明书4页 附图2页
CN 114564585 A
2022.05.31
CN 114564585 A
1.一种文本情感分析 方法, 其特 征在于: 包括以下步骤:
S1: 将文本句子中的词语转 为词向量;
S2: 将所述词向量映射 为情感特 征向量;
S3: 将所述词向量和所述情感特征向量拼接为每个词的情感特征词向量, 整个句子中
多个情感特 征词向量 一起作为输入特 征矩阵;
S4: 将所述输入特 征矩阵输入卷积神经网络进行训练, 获取第一抽象情感特 征;
S5: 将所述输入特 征矩阵输入双向长短期记 忆网络进行训练, 获取第二抽象情感特 征;
S6: 将所述第一抽象情感特征和所述第二抽象情感特征进行融合拼接, 再输入全连接
神经网络, 最后通过Softmax层输出句子的情感分类。
2.根据权利要求1所述的种文本情感分析方法, 其特征在于: 所述步骤S1具体为: 通过
分词工具讲句子划分为不同词语, 再将所述词语输入word2vec模型转为词向量, 所述
word2vec模型通过对大规模文本数据进行训练将高维稀疏的特征向量映射为低维稠密的
词向量。
3.根据权利要求2所述的文本情 感分析方法, 其特征在于: 所述步骤S2可以通过情 感词
典将所述词向量映射 为情感特 征向量。
4.根据权利要求3所述的文本情 感分析方法, 其特征在于: 所述步骤S2同时也要对否定
词和程度副词进行映射。
5.根据权利要求4所述的文本情 感分析方法, 其特征在于: 所述步骤S3设置句子输入的
最大长度为maxlen, 若长度小于maxlen, 则用0向量补全。
6.根据权利要求5所述的文本情 感分析方法, 其特征在于: 所述步骤S4的卷积神经网络
包括多层的卷积层和池化层, 最后输出的所述第一抽象情感特 征展开为一维特征。
7.根据权利要求5所述的文本情 感分析方法, 其特征在于: 所述步骤S5的双向长短期记
忆网络包括输入门、 输出门和遗 忘门, 最后输出的所述第二抽象情感特 征展开为一维特征。权 利 要 求 书 1/1 页
2
CN 114564585 A
2一种文本情 感分析方 法
技术领域
[0001]本发明属于自然语言处 理的应用领域, 尤其是 涉及一种文本情感分析 方法。
背景技术
[0002]随着终端移动设备的智能化和交互技术的高速发展, 使得人们的在线交流沟通更
加高效与频繁, 人们越来越习惯通过 互联网来表达自己的所思 所想, 发表自己的观点, 例如
在微博中对热点事件发表自己的看法及态度, 表达 自己的心情, 如何从互联网中的文本信
息中分析 出信息发布者的情感倾向, 是自然语言处 理领域的重要内容之一。
[0003]当前, 文本情感分析方法主要有基于情感词典的情感分析方法、 基于传统机器学
习的情感分析方法和基于深度学习的情感分析方法等。 基于情感词典的情感分析方法, 主
要依赖情感词典的构建, 在信息爆炸的今天, 各种网络流行语、 谐音语、 双关语等新词语层
出不穷, 这就要求情感词典不断扩充才能保证分析 的正确率; 而基于传统机器学习的情感
分析方法, 使用统计机器学习算法, 抽取文本情感特征, 输出情感分析结果, 往往过度依赖
文本情感特征 的提取方法以及分类器的设计, 也不能充分考虑上下文的语境信息, 也存在
一定的缺陷。
[0004]卷积神经网络(Convolution Neural Network,CNN), 长短期记忆网络(Long
Short‑Term Memory,LSTM)、 注意力机制等模型在自然语言领域得到了广泛研究与应用, 其
中也包含了在文本情感分析领域的应用, 这些方法可以自主学习文本信息高维度的、 深层
次的情感特征信息, 可以进一步提高分析的准确度, 但是这些方法会存在语义角色重叠、 高
维度文本词向量训练中难以收敛, 准确率 不高等问题。
发明内容
[0005]本发明的目的在于提供一种文本情感分析的方法, 通过词向量中加入情感特征,
并结合卷积神经网络模型和双向长短期记 忆网络来对文本情感特 征进行分类。
[0006]本发明是通过以下技 术方案实现的:
[0007]1.一种文本情感分析的方法, 包括以下步骤:
[0008]S1: 将文本句子中的词语转 为词向量;
[0009]S2: 将所述词向量映射 为情感特 征向量;
[0010]S3: 将所述词向量和所述情感特征向量拼接为每个词的情感特征词向量, 整个句
子中多个情感特 征词向量 一起作为输入特 征矩阵;
[0011]S4: 将所述输入特 征矩阵输入卷积神经网络进行训练, 获取第一抽象情感特 征;
[0012]S5: 将所述输入特征矩阵输入双向长短期记忆网络进行训练, 获取第二抽象情感
特征;
[0013]S6: 将所述第一抽象情感特征和第二抽象情感特征进行融合拼接, 再输入全连接
神经网络, 最后通过Softmax层输出句子的情感分类。
[0014]相对于现有技术, 本发明的方法可以提高文本情感识别的准确率, 并加快训练收说 明 书 1/4 页
3
CN 114564585 A
3
专利 一种文本情感分析方法
文档预览
中文文档
8 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共8页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 17:46:31上传分享