安全公司报告
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210232057.9 (22)申请日 2022.03.09 (71)申请人 平安科技 (深圳) 有限公司 地址 518000 广东省深圳市福田街道福安 社区益田路5 033号平安金融 中心23楼 (72)发明人 陈浩 (74)专利代理 机构 北京中强智尚知识产权代理 有限公司 1 1448 专利代理师 刘敏 (51)Int.Cl. G06F 40/211(2020.01) G06F 40/289(2020.01) G06F 40/30(2020.01) G06N 3/04(2006.01) G06N 3/08(2006.01)G06F 16/335(2019.01) G06F 16/9535(2019.01) G06Q 30/06(2012.01) (54)发明名称 句子向量生成方法、 装置、 计算机设备及存 储介质 (57)摘要 本申请公开了句子向量生成方法、 装置、 计 算机设备及存储介质, 涉及人工智能技术领域, 可以提升句子向量生成的准确性。 其中方法包 括: 对获取到的初始句子文本进行语义分割, 得 到分割后的句子文本; 利用预先构建的句子向量 生成模型, 通过用于预测所述句子文本上下文的 编码处理, 得到所述句子文本的向量表示, 所述 句子向量生成模型为训练好的序列到序列模型 的编码层。 本申请适用于基于图书文本句子向量 的图书推荐。 权利要求书2页 说明书10页 附图3页 CN 114444471 A 2022.05.06 CN 114444471 A 1.一种句子向量 生成方法, 其特 征在于, 包括: 对获取到的初始句子文本进行语义分割, 得到分割后的句子文本; 利用预先构建的句子向量生成模型, 通过用于预测所述句子文本上下文的编码处理, 得到所述句子文本的向量表示, 所述句子向量生成模型为训练好的序列到序列模型的编码 层; 其中, 所述训练好的序列到序列模型通过 下述步骤得到: 利用初始序列到序列模型, 对构建的句子样本集中的上下文句子对序列中的当前句子 进行编码处 理和上下文解码处 理, 得到所述当前句子的上文预测句子和下文预测句子; 根据上文预测句子和下文预测句子, 得到训练好的序列到序列模型。 2.根据权利要求1所述的方法, 其特征在于, 所述根据上文预测句子和下文预测句子, 得到训练好的序列到序列模型的步骤, 具体包括: 根据所述当前句子的上文预测句子和下文预测句子, 利用目标损失函数对所述初始序 列到序列模型进行训练, 得到训练好的序列到序列模型; 其中, 所述目标损失函数 是根据第一损失函数与第二损失函数之和 确定的。 3.根据权利要求1或2所述的方法, 其特 征在于, 所述上 下文句子对序列具体包括: 用于输入至所述初始序列到序列模型的编码层进行 上下文句子预测的当前句子; 以及, 用于训练所述初始序列到序列模型输出结果的上文目标句子和下文目标句子, 所述输出 结果为模型训练过程中输出的上文预测句子和下文预测句子 。 4.根据权利要求1所述的方法, 其特征在于, 所述利用 初始序列到序列模型, 对构建的 句子样本集中的上下文句子对序列中的当前句子进行编 码处理和上下文解码处理, 得到所 述当前句子的上文预测句子和下文预测句子的步骤, 具体包括: 根据所述上下文句子对序列, 利用分词工具进行分词处理得到分词后的上下文句子对 序列; 根据所述分词后的上下文句子对序列中的当前句子, 利用所述初始序列到序列模型的 编码层, 得到所述当前句子的句子嵌入向量; 根据所述当前句子的句子嵌入向量, 利用所述初始序列到序列模型中并行设置的两个 解码层, 分别得到上文预测句子和下文预测句子; 其中, 所述两个解码层是指用于预测上文的第一解码层, 以及用于预测下文的第二解 码层。 5.根据权利要求4所述的方法, 其特征在于, 所述用于预测上文的第一解码层为第一 GRU模型, 所述用于预测下文的第二解码层为第二GRU模型, 所述根据所述当前句子的句子 嵌入向量, 利用所述初始序列到序列模型中并行设置的两个解码层, 分别得到上文预测句 子和下文预测句子的步骤, 具体包括: 将所述当前句子的句子嵌入向量分别作为第一GRU模型中重置门、 更新门和候选记忆 单元的输入数据, 通过解码处 理得到当前句子的上文预测句子; 将所述当前句子的句子嵌入向量作为第二GRU模型的输入数据, 通过解码处理得到当 前句子的下文预测句子 。 6.根据权利要求2或4所述的方法, 其特征在于, 所述目标损 失函数中的第一损 失函数 是基于用于预测上文的第一解码层设定的, 所述目标损失函数中的第二损失函数是基于用权 利 要 求 书 1/2 页 2 CN 114444471 A 2于预测下文的第二 解码层设定的。 7.根据权利要求1所述的方法, 其特征在于, 所述利用所述句子向量生成模型, 通过用 于预测所述句 子文本上下文的编码处理, 得到所述句 子文本的向量表示的步骤之后, 还包 括: 计算所述句子文本的向量表示与预设图书样本库中的句子嵌入向量之间的相似度值; 根据所述预设图书样本库中相似度值满足预设条件的句子嵌入向量, 生成所述句子文 本的图书推荐信息; 其中, 所述预设图书样本库中的句子嵌入向量是利用所述句子向量生成模型输出得到 的。 8.一种句子向量 生成装置, 其特 征在于, 包括: 模型训练模块, 可以用于利用 初始序列到序列模型, 对构建的句子样本集中的上下文 句子对序列中的当前句子进行编码处理和上下文解码处理, 得到所述当前句子的上文 预测 句子和下文 预测句子; 以及, 根据上文 预测句子和下文 预测句子, 得到训练好的序列到序列 模型; 预处理模块, 用于对获取到的初始句子文本进行语义分割, 得到分割后的句子文本; 编码模块, 用于利用预先构建的句子向量生成模型, 通过用于预测所述句子文本上下 文的编码处理, 得到所述句 子文本的向量表示, 所述句 子向量生成模型为训练好的序列到 序列模型的编码层。 9.一种计算机设备, 包括存储介质、 处理器及存储在存储介质上并可在处理器上运行 的计算机程序, 其特征在于, 所述处理器执行所述程序时实现权利要求1至7中任一项所述 的句子向量 生成方法。 10.一种存储介质, 其上存储有计算机程序, 其特征在于, 所述程序被处理器执行时实 现权利要求1至7中任一项所述的句子向量 生成方法。权 利 要 求 书 2/2 页 3 CN 114444471 A 3
专利 句子向量生成方法、装置、计算机设备及存储介质
文档预览
中文文档
16 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 17:48:23
上传分享
举报
下载
原文档
(661.5 KB)
分享
友情链接
信通院 应用程序接口-API数据安全研究报告-2020年.pdf
等保二级-安全管理-安全管理制度.doc
GB-T 38289-2019 城市燃气设施运行安全信息分类与基本要求.pdf
T-XMYXH 0001—2023 厦门市医疗机构“规范药房”管理指南.pdf
GB-T 43208.1-2023 信息技术服务 智能运维 第1部分:通用要求.pdf
T-ZJPA 002—2022 医药化工企业节能降碳减排工程技术指南.pdf
DB52-T 1539.3-2021 政务云 第3部分:云计算平台运维管理规范 贵州省.pdf
DB43-T 2746-2023 特种设备使用单位安全风险评估和管控导则 湖南省.pdf
GB-T 33645-2017 钢、镍及镍合金的激光-电弧复合焊接工艺评定试验.pdf
GB 50057-2010建筑物防雷设计规范.pdf
DB42-T 1730-2021 破损山体植被修复技术规范 湖北省.pdf
NY-T 4047-2021 家禽精液品质检测方法.pdf
腾讯 数据安全治理与实践白皮书 2023.pdf
GB-T 18902-2002 超高频测距仪性能要求和测试方法.pdf
T-SCIIA 1—2020 数字化转型 新型基础设施建设产品与服务认定规范.pdf
GB 29415-2013 耐火电缆槽盒.pdf
GB-T 39412-2020 信息安全技术 代码安全审计规范.pdf
DB31-T 1309-2021 数据中心节能改造技术规范 上海市.pdf
GB-T 37227.1-2018 制冷系统绩效评价与计算测试方法 第1部分:蓄能空调系统.pdf
CISSP权威指南(AIO)第8版 中文.pdf
1
/
3
16
评价文档
赞助2.5元 点击下载(661.5 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。