安全公司报告
文库搜索
切换导航
文件分类
频道
联系我们
问题反馈
文件分类
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210093522.5 (22)申请日 2022.01.26 (71)申请人 上海易康源医疗健康科技有限公司 地址 200120 上海市浦东 新区中国(上海) 自由贸易试验区临港新片区新杨公路 860号10幢 (72)发明人 曾祥云 朱姬渊 (74)专利代理 机构 上海硕力知识产权代理事务 所(普通合伙) 31251 专利代理师 王法男 (51)Int.Cl. G06F 16/9532(2019.01) G06F 16/33(2019.01) G06F 40/211(2020.01) G06F 40/30(2020.01)G06K 9/62(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 一种神经网络训练方法、 语义检索方法及系 统 (57)摘要 本发明公开一种神经网络训练方法, 包括步 骤: S1:对句子进行标注; S2:将标注好的句子输 入神经网络模型; S3:设置损失函数; S4:根据损 失函数的损失值, 对神经网络进行训练。 本发明 采取的技术方案使用的神经网络训练方法得到 的模型参数少, 检索速度快, 能够获取文本的语 义信息, 从而提高了 检索的准确率。 权利要求书1页 说明书4页 附图1页 CN 114443936 A 2022.05.06 CN 114443936 A 1.一种神经网络训练方法, 其特 征是, 包括步骤: S1:对句子进行 标注; S2:将标注好的句子 输入神经网络模型; S3:设置损失函数; S4:根据损失函数的损失值, 对神经网络进行训练。 2.如权利要求1所述的神经网络训练方法, 其特征是, 步骤S1:对句子进行标注为: sentenceA, sentenceB, Score。 3.如权利要求1所述的神经网络训练方法, 其特征是, 步骤S3:设置损 失函数中的损失 函数公式为: 其中, m为训练的样本数量, label为人工标注的sentenceA和sentenceB的相似度, EsentenceA和EsentenceB为神经网络模型中抽取 出来的句向量, cos为 余弦相似度。 4.如权利要求1所述的神经网络训练方法, 其特征是, S2:将标注好的句子输入神经网 络模型包括 步骤: 将字向量、 位置编码、 字所在的句子信息均设置为128维; 将上述各向量乘以矩阵, 得到768维的向量; 输入神经网络, 得到句子特 征F, 句子特 征维度为: 输入句子个数*最长句子 长度*768; 将句子特 征F输入至卷积神经网络, 对句子的每 个字的特 征进行加权求和。 5.如权利要求1所述的神经网络训练方法, 其特征是, 所述神经网络结构为依次串联的 6对transformer 组和卷积神经网络构 成, 其中, 每对transformer 组由二层transformer构 成, 每组的t ransformer参数完全 共享。 6.一种基于神经网络的语义检索方法, 其特 征是, 包括步骤: 对文本库进行计算得到特 征向量E_total, 并存 储; 将用户查询的信息转换为向量S_f; 计算S_f和E_total的余弦相似度; 将余弦相似度得分最高的前N条句子返回检索结果。 7.一种基于神经网络的语义检索系统, 其特征是, 包括采集模块、 处理模块以及输出模 块, 其中: 采集模块对文本库进行计算得到特 征向量E_total, 并存 储; 处理模块用以对用户的输入的信息进行处 理; 输出模块用以将处 理模块的处 理结果返回给用户。 8.一种计算机可读存储介质, 其特征是, 所述存储介质中存储有指令或者程序, 所述指 令或者程序由处 理器加载并执 行以实现如权利要求6所述的语义检索方法。 9.一种电子设备, 其特征是, 包括: 处理器、 存储介质和总线, 所述存储介质存储有所述 处理器可执行 的机器可读指令, 当电子设备运行时, 所述处理器与所述存储介质之间通过 总线通信, 所述处 理器执行所述机器可读指令, 以执 行如权利要求6所述的语义检索方法。权 利 要 求 书 1/1 页 2 CN 114443936 A 2一种神经 网络训练方 法、 语义检索方 法及系统 技术领域 [0001]本发明涉及信息检索技术领域, 尤其涉及一种神经网络训练方法、 语义检索方法 及系统。 背景技术 [0002]海量的信息中, 信息搜索是重要的技术之一, 由于语言的特点, 同一个意思, 都会 有较多的相同以及相似的词汇进行表达, 为了更进一步检索到想要的信息, 有的还基于句 子的意思 进行概括和总结。 [0003]随着自然语言处理技术的发展, 语义搜索作为信息搜索搜得到了快速 的发展, 语 音搜索能从海量的文本中, 根据用户输入的词语或者句 子, 能够搜索出语义相同或者相似 的语句, 由于其具有深度的信息检索和挖掘能力, 在文 献搜索、 智能客户、 智能问答、 推荐系 统等领域得到 了广泛的应用。 [0004]现有技术中, 有的语义搜索技术已经结合深度神经网络来进行探索, 现有的检索 算法主要是基于文本相似度bm2.5和tf ‑idf(term frequency –inverse document frequency)来实现, 其技术缺陷在于, 只能能够计算词的词频特征, 检索的词在 文本中出现 才可以被检索到。 只能获取词 频信息, 但是很难获取文本的语义信息, 如果不出现, 但是语 义相近的词无法被 检索到。 导致其检索准确率 不高。 发明内容 [0005]本发明为解决现有技术中存在的技术问题, 提供一种神经网络训练方法, 包括步 骤: [0006]S1:对句子进行 标注; [0007]S2:将标注好的句子 输入神经网络模型; [0008]S3:设置损失函数; [0009]S4:根据损失函数的损失值, 对神经网络进行训练。 [0010]进一步地, 步骤S1:对句子进行 标注为: sentenceA, sentenceB, Score。 [0011]进一步地, 步骤S3:设置损失函数中的损失函数公式为: [0012] [0013]其中, m为训练的样本数量, label为人工标注的sentenceA和sentenceB的相似度, EsentenceA和EsentenceB为神经网络模型中抽取 出来的句向量, cos为 余弦相似度。 [0014]进一步地, S2:将标注好的句子 输入神经网络模型包括 步骤: [0015]将字向量、 位置编码、 字所在的句子信息均设置为128维; [0016]将上述各向量乘以矩阵, 得到768维的向量; [0017]输入神经网络, 得到句子特征F, 句子特征维度为: 输入句子个数*最长句子长度* 768;说 明 书 1/4 页 3 CN 114443936 A 3
专利 一种神经网络训练方法、语义检索方法及系统
文档预览
中文文档
7 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
赞助2元下载(无需注册)
温馨提示:本文档共7页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2元下载
本文档由 SC 于
2024-02-18 22:33:43
上传分享
举报
下载
原文档
(310.6 KB)
分享
友情链接
杨泉 数据管理能力成熟度评估模型 DCMM标准解读 2022.pdf
GB-T 6892-2015 一般工业用铝及铝合金挤压型材.pdf
GB-T 37094-2018 信息安全技术 办公信息系统安全管理要求.pdf
JR-T0197-2020 金融数据安全 数据安全分级指南.pdf
DB36-T 1952-2024 制造业企业数字化发展水平评价指南 江西省.pdf
GB-T 1216-2018 外径千分尺.pdf
信通院 助力抗击疫情保障复工复产云服务产品应用参考指南.pdf
DPO 非个人数据自由流动框架条例 中文版.pdf
DB50-T 1125.4-2021 区域性气象灾害过程评估规范 第4部分:低温 重庆市.pdf
ISO 9241 820 2024 Ergonomics of human system interaction Part 820 Ergonomic guidance on interzctions in immersive environments including augmented reality and virtual reality.pdf
NB-T 10509-2021 水电建设项目水土保持技术规范.pdf
GB-T 24581-2022 硅单晶中III、V族杂质含量的测定 低温傅立叶变换红外光谱法.pdf
T-CI 047—2021 医用镥[177Lu]及其放射性药物的 质量标准.pdf
GB-T 26262-2010 通信产品节能分级导则.pdf
框架架构TOGAF学习指南.pdf
ISO IEC 19770-11 2021 Information technology — IT asset management — Part 11 Requirements for bodies providing audit and certification of IT asset management systems.pdf
GB-T 18312-2015 双筒望远镜检验规则.pdf
GB-T 29871-2013 能源计量仪表通用数据接口技术协议.pdf
GB/T 23827-2021 道路交通标志板及支撑件.pdf
DB14-T 2136-2020 《特种设备风险分级管控实施指南》 山西省.pdf
交流群
-->
1
/
7
评价文档
赞助2元 点击下载(310.6 KB)
回到顶部
×
微信扫码支付
2
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。