安全公司报告
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210390696.8 (22)申请日 2022.04.14 (71)申请人 西安邮电大 学 地址 710121 陕西省西安市长安区西长安 街618号 (72)发明人 曹小鹏 尤聪聪 赵维维 (51)Int.Cl. G06F 16/34(2019.01) G06F 40/30(2020.01) G06N 3/04(2006.01) G06N 3/08(2006.01) G06F 17/10(2006.01) (54)发明名称 一种融合语义图的文本摘要生成方法 (57)摘要 本发明提出一种融合语义图的文本摘要生 成方法, 传统单一模型解决文本摘要生成时表现 较差的问题, 本发明的技术方案主要包括以下步 骤: (1)提取文本 上下文特征(2)提取语义图特征 (3)融合文本上下文特征和语义图特征(4)词向 量预测(5)模型训练, 生成文本摘要。 该方法主要 应用于文本摘要生成应用。 权利要求书1页 说明书5页 附图1页 CN 114691859 A 2022.07.01 CN 114691859 A 1.一种融合语义图的文本摘要生成方法, 其特 征在于包括以下步骤: (1)提取文本上下文特征: 利用文本编码器对原始文本进行编码, 提取文本的上下文特 征; (2)提取语义图特征: 利用开放信息提取技术提取原始文本三元组结构, 利用斯坦福自 然语言处理工具对三元组进行指代消 解, 构建原始文本的图结构, 最后利用图注意力网络 提取图结构特 征; (3)融合文本上下文特征和语义图特征: 利用解码器的隐藏状态并结合注意力机制计 算文本上 下文向量以及图结构向量, 然后将两者 拼接得到文本序列向量。 (4)词向量预测: 利用文本序列向量以及指针网络预测下一时刻的词向量; (5)模型训练, 生成文本摘要: 利用损失函数对该模型进行训练, 训练过后生成文本摘 要。权 利 要 求 书 1/1 页 2 CN 114691859 A 2一种融合 语义图的文本摘要生成方 法 技术领域 [0001]本发明属于计算机自然语言处理领域, 具体涉及 一种融合语义图的文本摘要生成 方法。 背景技术 [0002]自动文本摘要属于自然语言处理领域的研究热点, 随着深度神经网络技术的出现 和发展, 特别是基于序列到序列模型在自动文本摘要上 的成功运用, 促进了自动文本摘要 技术的快速发展。 在序列到序列模型中, 编码器和解码器一般是基于循环神经网络 (Recurrent Neural Network, RNN)以及长短期记忆网络(Long Short‑Term Memory, LSTM)。 LSTM是对RNN的优化, 通过输入门、 遗忘门、 输出门三个结构来实现对信息的保护和 控制, 改善了长期依赖问题。 虽然LSTM提取到文本上下文 特征, 但是对于原始文本的语句结 构特征并没有提取到, 导 致生成的摘要偏离 输入语句语义, 摘要质量并不理想 。 [0003]Rush等人受神经机器翻译的启发, 首次将Se q2Seq模型运用到生成式摘要任务, 提 出一种基于神经注 意的抽象摘要模 型, 取得了不错的效果。 随后, Chopra等人对其进行了优 化和扩展, 解码器选用RNN, 在Gigaword数据集上取得了很好的效果, 进一步提升了生成式 文本摘要的质量, 但是对于摘要生成过程中出现的未登录词以及重复生成问题, 模型并没 有解决。 基于此, Gu等人将复制机制应用于Seq2Seq中, 提出一种新模型CopyNet, 该模型把 单词生成与复制机制结合, 不仅可以保留文本重要的信息, 而且可以生成新的单词, 很好的 解决了未登录词问题。 同一时期, See等人把覆盖机制应用于摘要生成中, 很好的缓解了重 复生成问题, 取得了 当时最先进的结果。 虽然之前的研究已经取得了不错的效果, 但是并没 有解决Seq2Seq模型曝光偏 差问题。 Paulus等人提出在编码器 ‑解码器模型中加入强化学习 来解决这个问题, 他们采用自批评策略梯度算法训练模型, 有效解决上面的问题, 提高了生 成摘要的可读性。 [0004]Takase等人提出了一种基础注意力机制的摘要生成模型, 利用抽象意义表示引导 摘要生成, 取得了不错的效果, 但是模型并没有同原始文本内容进行结合。 Cao等人提出双 注意力模 型, 把原始文本和从中提取的事实作为条件, 提高了生成摘要的准确性, 但是在常 识性错误上还有待提高。 Li等人提出一种双重注意力指针模型, 利用自注意力机制产生原 始文本的关键特性, 让其与 原始文本信息融合生成摘要, 弥补了摘要关键特性不足的缺点, 但并没有对文本的深层语义进 行分析, 导致生成的摘要与 原始文本语义还有偏差。 Cui等人 提出一种针对多文档摘要生成的模型, 通过对多个文档构建异构图, 同时引入主题建模发 现潜在主题, 两者结合生成了高质量的摘要。 Thong等人针对现有模型中短程依赖问题, 引 入具有规范化流的神经主题模型以捕获文本的全局语义, 有效解决了该问题。 但是该模型 并没有考虑到把文本语句的结构信息和语句中实体之 间的联系同摘要生成过程结合起来, 导致生成的摘要质量 不佳。说 明 书 1/5 页 3 CN 114691859 A 3
专利 一种融合语义图的文本摘要生成方法
文档预览
中文文档
8 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共8页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 17:47:24
上传分享
举报
下载
原文档
(497.2 KB)
分享
友情链接
T-SCCIA 013—2023 机器人通行领域的身份鉴别密码应用指南.pdf
安全村文集 第2辑 .pdf
华为 数据治理之旅.pdf
腾讯安全 等保2.0体系互联网合规实践白皮书 2020.pdf
GB-T 30503-2014 船用制氮装置通用技术条件.pdf
GB-T 38664.1-2020 信息技术 大数据 政务数据开放共享 第1部分:总则.pdf
GB-T 37939-2019 信息安全技术 网络存储安全技术要求.pdf
GB-T 21296.1-2020 动态公路车辆自动衡器 第1部分:通用技术规范.pdf
GB-T 34680.4-2018 智慧城市评价模型及基础评价指标体系 第4部分:建设管理.pdf
T-CAAMTB 112—2023 智能商用车线控底盘 接口 技术规范.pdf
DB36-T 1234-2020 智慧景区建设指南 江西省.pdf
GB-T 19707-2005 冰刀鞋.pdf
T-CSAE 251—2022 V2X车载终端安全芯片处理性能测试方法.pdf
GB-T 37401-2019 电子商务平台服务保障技术要求.pdf
GB-T 31392-2022 煤矿矿井水利用技术导则.pdf
T-ACEF 065—2023 重金属污染土壤生态风险评估技术指南.pdf
DB3302-T 1122-2021 数字化车间 智能工厂评估规范 宁波市.pdf
T-CSAE 260—2022 智能网联汽车视觉感知计算芯片技术要求和测试方法.pdf
GB-T 25341.1-2019 铁路旅客运输服务质量 第1部分:总则.pdf
DB35-T 2134-2023 高辣辣椒栽培技术规程 福建省.pdf
1
/
3
8
评价文档
赞助2.5元 点击下载(497.2 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。