(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210208867.0
(22)申请日 2022.03.03
(71)申请人 平安国际智慧城市科技股份有限公
司
地址 518000 广东省深圳市前海深港合作
区妈湾兴海 大道3048号前海自贸大厦
1-34层
(72)发明人 陈芷昕
(74)专利代理 机构 广州嘉权专利商标事务所有
限公司 4 4205
专利代理师 廖慧贤
(51)Int.Cl.
G06F 16/34(2019.01)
G06F 16/35(2019.01)
G06F 40/216(2020.01)G06F 40/289(2020.01)
G06F 40/30(2020.01)
G06K 9/62(2022.01)
(54)发明名称
政策文本摘要生成方法、 装置、 电子设备及
存储介质
(57)摘要
本发明实施例公开了一种政策文本摘要生
成方法、 装置、 电子设备及存储介质, 该政策文本
摘要生成方法通过获取候选政策文本的候选标
题, 对候选标题进行分类, 得到候选政策文本对
应的政策类别, 从候选政策文本中确定文本关键
词, 确定文本关键词在预设的关键词数据库中出
现的第一频次, 根据第一频次确定候选政策文本
的文本重要度, 根据文本重要度在各个政策类别
的候选政策文本中确定目标政策文本, 从目标政
策文本中提取出目标关键句, 根据目标关键句生
成目标政策文本对应的政策类别的政 策摘要, 相
较于人工整理能够自动且快速地生成政策摘要,
能够提高生成政策文本摘要的效率 以及提高生
成政策摘要的准确性。
权利要求书2页 说明书13页 附图6页
CN 114756673 A
2022.07.15
CN 114756673 A
1.一种政策文本摘要生成方法, 其特 征在于, 包括:
获取候选政策文本的候选标题, 对所述候选标题进行分类, 得到所述候选政策文本对
应的政策类别;
从所述候选政策文本中确定文本关键词, 确定所述文本关键词在预设的关键词数据库
中出现的第一频次, 根据所述第一频次确定所述 候选政策文本的文本 重要度;
根据所述文本 重要度在各个所述政策类别的所述 候选政策文本中确定目标政策文本;
从所述目标政策文本中提取出目标关键句, 根据 所述目标关键句生成所述目标政策文
本对应的所述政策类别的政策摘要。
2.根据权利要求1所述的政策文本摘要生成方法, 其特征在于, 所述对所述候选标题进
行分类, 得到所述 候选政策文本对应的政策类别, 包括:
对所述候选标题进行分词处 理, 得到标题关键词;
确定所述标题关键词在所述候选政策文本中出现的第 二频次, 根据所述第 二频次计算
所述标题关键词的关键词向量;
根据所述关键词向量计算所述 候选标题的标题向量;
根据所述标题向量对所述候选标题进行分类处理, 得到所述候选政策文本对应的政策
类别。
3.根据权利要求1所述的政策文本摘要生成方法, 其特征在于, 所述从所述候选政策文
本中确定文本关键词, 包括:
对所述候选政策文本进行分词处 理, 得到文本候选词;
计算所述文本候选词在所述 候选政策文本中的关键词分值;
按照所述关键词分值由大到小的顺序对所述文本候选词进行排序, 将排名处于第 一阈
值之前的所述文本候选词确定为文本关键词; 或者按照所述关键词分值由小到大的顺序对
所述文本候选词进行排序, 将排名处于第二阈值之后的所述文本候选词确定为文本关键
词。
4.根据权利要求3所述的政策文本摘要生成方法, 其特征在于, 所述根据 所述第一频次
确定所述 候选政策文本的文本 重要度, 包括:
根据所述第 一频次与 所述文本关键词对应的所述关键词分值之间的乘积, 得到所述文
本关键词的词语重要度;
根据所述候选政策文本 中所有所述文本关键词的所述词语重要度之和, 得到所述候选
政策文本的文本 重要度。
5.根据权利要求1所述的政策文本摘要生成方法, 其特征在于, 所述根据 所述文本重要
度在各个所述政策类别的所述 候选政策文本中确定目标政策文本, 包括:
在各个所述政策类别中, 按照所述文本重要度由大到小的顺序对所述候选政策文本进
行排序, 将排名处于第三阈值之前的所述候选政策文本确定为对应的所述政策类别中的目
标政策文本;
或者, 在各个所述政策类别 中, 按照所述文本重要度由小到大的顺序对所述候选政策
文本进行排序, 将排名处于第四阈值之后的所述候选政策文本确定为对应的所述政策类别
中的目标政策文本 。
6.根据权利要求1所述的政策文本摘要生成方法, 其特征在于, 所述从所述目标政策文权 利 要 求 书 1/2 页
2
CN 114756673 A
2本中提取 出目标关键句, 包括:
对所述目标政策文本进行分句处 理, 得到目标候选句;
对所述目标候选句进行向量 化处理, 得到候选句向量;
根据所述 候选句向量计算每两个所述目标候选句之间的相似度值;
根据所述相似度值计算所述目标候选句对应的候选句分值;
按照所述候选句分值由大到小的顺序对所述目标候选句进行排序, 将排名处于第五阈
值之前的所述目标候选句确定为目标关键句; 或者按照所述候选句分值由小到大的顺序对
所述目标候选句进行排序, 将排名处于第六阈值之后的所述目标候选句确定为目标关键
句。
7.根据权利要求6所述的政策文本摘要生成方法, 其特征在于, 所述根据 所述相似度值
计算所述目标候选句对应的候选句分值, 包括:
将所述目标候选句作为句子节点, 所述相似度值作为对应的两个所述句子节点之间的
连接边, 根据所述句子节点与所述连接边构建候选句图;
确定所述句子节点的初始分值以及概率系数, 所述概率系数用于表征所述句子节点指
向所述候选句图中其 他任一节点的概 率;
根据所述概率系数以及所述相似度值在所述候选句图中传播更新所述初始分值直至
收敛, 将收敛时的所述初始分值作为所述目标候选句对应的候选句分值。
8.一种政策文本摘要生成装置, 其特 征在于, 包括:
政策文本分类模块, 用于获取候选政策文本的候选标题, 对所述候选标题进行分类, 得
到所述候选政策文本对应的政策类别;
文本重要度确定模块, 用于从所述候选政策文本中确定文本关键词, 确定所述文本关
键词在预设的关键词数据库中出现的第一频次, 根据所述第一频次确定所述候选政策文本
的文本重要度;
目标政策文本确定模块, 用于根据 所述文本重要度在各个所述政策类别的所述候选政
策文本中确定目标政策文本;
政策摘要生成模块, 用于从所述目标政策文本中提取出目标关键句, 根据所述目标关
键句生成所述目标政策文本对应的所述政策类别的政策摘要。
9.一种电子设备, 其特征在于, 包括存储器、 处理器, 所述存储器存储有计算机程序, 所
述处理器执行所述计算机程序时实现权利要求1至7中任意一项所述的政策文本摘要生成
方法。
10.一种计算机可读存储介质, 其特征在于, 所述存储介质存储有程序, 所述程序被处
理器执行实现权利要求1至7中任意 一项所述的政策文本摘要生成方法。权 利 要 求 书 2/2 页
3
CN 114756673 A
3
专利 政策文本摘要生成方法、装置、电子设备及存储介质
文档预览
中文文档
22 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共22页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 17:50:41上传分享