安全公司报告
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210072438.5 (22)申请日 2022.01.21 (71)申请人 北京金堤科技有限公司 地址 100086 北京市海淀区知春路6 5号院1 号楼B座20层20 01号 (72)发明人 刘文强  (74)专利代理 机构 北京工信联合知识产权代理 有限公司 1 1266 专利代理师 贾银秋 (51)Int.Cl. G06F 16/35(2019.01) G06F 40/30(2020.01) G06Q 10/06(2012.01) (54)发明名称 舆情预警方法、 装置、 可读存储介质及电子 设备 (57)摘要 本发明提供了一种舆情预警方法、 装置、 可 读存储介质及其电子设备, 舆情预警方法包括: 获取舆情文本, 根据预先设定的事件 标签确定所 述舆情文本中包括的事件, 确定所述舆情文本中 与所述事件对应的事件主体, 确定所述舆情文本 中所述事件主体的情感极性, 将所述舆情文本与 所述事件主体和所述事件 标签关联。 采用本方法 能够从大量舆情新闻中获得关注度较高且风险 较大的新闻, 进一步准确地确定出与该舆情关联 的主体, 避免了一些无关紧要的舆情新闻与其关 系不大的主体进行关联事件的发生, 同时, 通过 本方法能够准确判断出该舆情新闻所表达的情 感对应的主体, 并与之关联, 以使用户可 以通过 事件标签获取到主体对应的预警舆情以及通过 舆情确定风险信息 。 权利要求书3页 说明书14页 附图3页 CN 114741501 A 2022.07.12 CN 114741501 A 1.一种舆情预警方法, 其特 征在于, 所述方法包括: 获取舆情文本; 根据预先设定的事 件标签确定所述舆情文本中包括的事 件; 确定所述舆情文本中与所述事 件对应的事 件主体; 确定所述舆情文本中所述事 件主体的情感极性; 响应于根据所述事件主体对应的情感极性确定所述舆情文本符合预警条件, 将所述舆 情文本与所述事件主体和所述事件标签关联, 以使用户通过所述事件标签获取到所述事件 主体的风险信息 。 2.根据权利要求1所述的方法, 其特 征在于, 所述方法还 包括: 使用垃圾语料词集 合, 判断所述舆情文本的质量; 若根据所述舆情文本的质量确定所述舆情文本为垃圾舆情, 则对所述舆情文本执行过 滤处理; 若根据所述舆情文本的质量确定所述舆情文本为有 效舆情, 则执行所述根据 预先设定 的事件标签确定所述舆情文本中包括的事 件的步骤。 3.根据权利要求1所述的方法, 其特征在于, 所述确定所述舆情文本 中与所述事件对应 的事件主体, 具体包括: 使用事件主体字典树, 对所述舆情文本进行事件主体挖掘, 以获得所述舆情文本中的 第一事件主体; 通过事件主体识别模型, 对所述舆情文本进行事件主体识别, 以获得所述舆情文本中 的第二事 件主体; 基于所述舆情文本 中的第一事件主体和所述舆情文本 中的第二事件主体, 确定所述舆 情文本中的所述事 件主体。 4.根据权利要求3所述的方法, 其特征在于, 所述确定所述舆情文本 中的所述事件主体 之后, 还包括: 确定所述事件主体在所述舆情文本中出现的频次或者所述事件主体在所述舆情文本 中以第一人称视角出现的频次; 基于所述事件主体在所述舆情文本中的出现频次或者所述事件主体在所述舆情文本 中以第一人称视角出现的频次, 确定所述事 件主体与所述舆情文本的相关性; 基于所述事 件主体与所述舆情文本的相关性, 确定最终的事 件主体。 5.根据权利要求1所述的方法, 其特征在于, 所述确定所述舆情文本 中与所述事件对应 的事件主体, 具体包括: 将所述舆情文本进行分句分词处 理得到多个主体; 确定所述多个主体中的各个主体在所述舆情文本中以第一人称视角出现的频次; 基于所述各个主体在所述舆情文本中以第 一人称视角出现的频次, 确定与 所述事件对 应的事件主体。 6.根据权利要求1所述的方法, 其特征在于, 所述将所述舆情文本进行分句分词处理得 到多个主体, 具体包括: 响应于舆情文本为中文文本, 根据最终标识符对所述舆情文本进行分句得到多个语 句;权 利 要 求 书 1/3 页 2 CN 114741501 A 2响应于舆情文本为英文文本, 根据 预设标号和大写字母的组合方式对所述舆情文本进 行分句得到多个 语句; 对所述多个语句中的每个语句根据句子构成方式进行分词, 得到每个语句的执行主 语, 将所述执 行主语作为所述舆情文本中出现的多个主体。 7.根据权利要求1所述的方法, 其特征在于, 所述根据预先设定的事件标签确定所述舆 情文本中包括的事 件, 包括: 根据所述预 先设定的事 件标签对文本进行语料 标注得到 舆情样本数据; 基于所述舆情样本数据根据多标签分类模型方法对模型进行机器学习得到第一识别 模型; 通过所述第一识别模型确定所述舆情文本中包括的事 件。 8.根据权利要求1所述的方法, 其特征在于, 所述根据预先设定的事件标签确定所述舆 情文本中包括的事 件, 包括: 将所述预 先设定的事 件标签分类得到第一级事 件标签和第二级事 件标签; 根据所述第一级事 件标签对文本进行语料 标注得到第一舆情 样本数据; 基于所述第一舆情 样本数据对 模型进行机器学习得到第一语义交 互数据; 通过所述第一语义交互数据确定所述舆情文本中包括的与所述第一级事件标签对应 的事件; 根据所述第二级事 件标签对文本进行语料 标注得到第二舆情 样本数据; 基于所述第二舆情 样本数据对 模型进行机器学习得到第二语义交 互数据; 通过所述第二语义交互数据确定所述舆情文本中包括的与所述第二级事件标签对应 的事件。 9.根据权利要求1所述的方法, 其特征在于, 所述确定所述舆情文本 中与所述事件对应 的事件主体, 包括: 根据所述预先设定的事件标签和事件主体标签对文本进行语料标注得到舆情样本数 据; 基于所述舆情 样本数据根据二分类模型 方法对模型进行机器学习得到第二识别模型; 通过所述第二识别模型确定所述舆情文本中与所述事 件对应的事 件主体。 10.根据权利要求9所述的方法, 其特征在于, 所述确定所述舆情文本中与所述事件主 体对应的情感极性, 包括: 基于预先配置的情感问题模板, 对舆情样本数据中的事件主体进行扩展, 以获得所述 舆情样本数据中的事 件主体的情感问题文本; 基于所述情感问题文本中的字符的语义特征表征数据和所述舆情文本中的字符的语 义特征表征数据, 对所述情感问题文本与所述舆情文本进行语义交互处理, 以获得所述情 感问题文本与所述舆情文本的语义交 互数据; 通过事件主体情感预测模型, 基于所述情感问题文本与所述舆情文本的语义交互数 据, 确定所述事 件主体在所述舆情文本中的情感极性。 11.根据权利要求10所述的方法, 其特征在于, 所述基于所述情感问题文本 中的字符的 语义特征表征数据和所述舆情文本中的字符的语义特征表征数据, 对所述情感问题文本与 所述舆情文本进 行语义交互处理, 以获得所述情感问题文本与所述舆情文本的语义交互数权 利 要 求 书 2/3 页 3 CN 114741501 A 3

PDF文档 专利 舆情预警方法、装置、可读存储介质及电子设备

文档预览
中文文档 21 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共21页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 舆情预警方法、装置、可读存储介质及电子设备 第 1 页 专利 舆情预警方法、装置、可读存储介质及电子设备 第 2 页 专利 舆情预警方法、装置、可读存储介质及电子设备 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:33:48上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。