安全公司报告
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210179812.1 (22)申请日 2022.02.25 (71)申请人 阿里云计算有限公司 地址 310024 浙江省杭州市西湖区转塘科 技经济区块12号 (72)发明人 汪诚愚 邱明辉 黄俊 (74)专利代理 机构 北京博思佳知识产权代理有 限公司 1 1415 专利代理师 王茹 (51)Int.Cl. G06F 16/35(2019.01) G06F 40/284(2020.01) G06F 40/30(2020.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 模型训练方法、 计算机 设备及计算机可读存 储介质 (57)摘要 本说明书一个或多个实施例提供一种模型 训练方法、 计算机设备及计算机可读存储介质, 所述模型训练方法包括: 获取待训练模型; 获取 第一数据集; 利用所述第一数据集对 所述待训练 模型进行训练; 其中, 所述第一数据集中第一数 据为文本, 所述第一数据中提供有掩蔽标记以及 至少两个候选项, 所述至少两个候选项的其中一 个候选项用于提示所述掩蔽标记对应的单词, 以 使所述待训练模型在所述至少两个候选项的提 示下, 在预测所述掩蔽标记对应的单词时从所述 至少两个候选项中进行选择。 权利要求书2页 说明书12页 附图3页 CN 114610878 A 2022.06.10 CN 114610878 A 1.一种模型训练方法, 所述方法包括: 获取预训练模型; 获取第一数据集; 利用所述第一数据集对所述预训练模型进行训练; 其中, 所述第一数据集中第一数据 为文本, 所述第一数据中提供有掩蔽标记以及至少 两个候选项, 所述至少 两个候选项的其 中一个候选项用于提示所述掩蔽标记对应的单词, 以使所述预训练模型在所述至少两个候 选项的提 示下, 在预测所述掩蔽标记对应的单词时从所述至少两个候选项中进行选择; 存储训练好的模型, 所述训练好的模型应用于下游任务。 2.根据权利要求1所述的方法, 所述训练好的模型应用于下游任务的小样本学习场景。 3.根据权利要求1所述的方法, 所述方法还 包括: 接收用户发起的模型训练请求, 所述模型训练请求包括用户提供的第二数据集, 所述 第二数据集的数据数量小于预设阈值; 从存储的模型中选取模型; 利用用户提供的第二数据集, 对选取的模型进行训练后提供 给所述用户。 4.根据权利要求3所述的方法, 所述方法还 包括: 展示数据提示信息, 所述数据提示信息用于提示用户: 第二数据集中第二数据提供掩 蔽标记以及至少两个候选项, 所述至少两个候选项的其中一个候选项用于提示所述掩蔽标 记对应的单词。 5.根据权利要求1或3所述的方法, 所述至少两个候选项以提问的形式提供, 以使模型 基于所述 提问, 在预测所述掩蔽标记对应的单词时从所述至少两个候选项中进行选择。 6.根据权利要求1或3所述的方法, 所述至少两个候选项中其中一个候选项用于提示: 所述掩蔽标记对应的单词的反义词。 7.根据权利要求1或3所述的方法, 所述第一数据和/或第二数据通过如下 方式获得: 获取无标签文本, 将所述无标签文本进行分词处理得到多个单词, 从所述多个单词中 识别出形容词, 对其中一个形容词替换为掩蔽标记后获得的。 8.一种模型训练方法, 包括: 获取待训练模型; 获取第一数据集; 利用所述第一数据集对所述待训练模型进行训练; 其中, 所述第一数据集中第一数据 为文本, 所述第一数据中提供有掩蔽标记以及至少 两个候选项, 所述至少 两个候选项的其 中一个候选项用于提示所述掩蔽标记对应的单词, 以使所述待训练模型在所述至少两个候 选项的提 示下, 在预测所述掩蔽标记对应的单词时从所述至少两个候选项中进行选择。 9.根据权利要求8所述的方法, 所述第一数据采用提问的形式提供有所述至少两个候 选项, 以使所述待训练模型基于所述提问, 在预测所述掩蔽标记对应的单词时从所述至少 两个候选项中进行选择; 和/或, 所述第一数据通过如下方式获得: 获取无标签文本, 将所述无标签文本进行分词处理 得到多个单词, 从所述多个单词中识别出形容词, 对其中一个形容词替换为掩蔽标记后获 得的; 和/或, 所述至少两个候选项中其中一个候选项用于提示: 所述掩蔽标记对应的单词的反义权 利 要 求 书 1/2 页 2 CN 114610878 A 2词。 10.一种计算机设备, 包括存储器、 处理器及存储在存储器上并可在处理器上运行的计 算机程序, 其中, 所述处 理器执行所述程序时实现权利要求1至9任一所述的方法。 11.一种计算机可读存储介质, 所述计算机可读存储介质上存储有若干计算机指令, 所 述计算机指令被执 行时实现权利要求1至9任一项所述方法的步骤。权 利 要 求 书 2/2 页 3 CN 114610878 A 3
专利 模型训练方法、计算机设备及计算机可读存储介质
文档预览
中文文档
18 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 17:51:37
上传分享
举报
下载
原文档
(569.3 KB)
分享
友情链接
WS-T 794-2022 输血相容性检测标准.pdf
WS-T 599.1-2018 医院人财物运营管理基本数据集第1部分:医院人力资源管理.pdf
T-CNFPIA 3007—2019 超薄高密度纤维板.pdf
产业互联网联盟 零信任实战白皮书 2019.pdf
T-CSTM 00839—2022 材料基因工程 术语.pdf
NB-T 10691-2021 数据中心机房用不间断电源系统.pdf
GB-T 2350-2020 流体传动系统及元件 活塞杆螺纹型式和尺寸系列.pdf
GB-T 42754-2023 干式化学分析仪性能评价通则.pdf
GB-T 14721-2010 林业资源分类与代码 森林类型.pdf
GM-T 0109-2021 基于云计算的电子签名服务技术要求.pdf
GB-T 21023-2007 中文语音识别系统通用技术规范.pdf
GB/T 40212-2021 工业机器人云服务平台分类及参考体系结构.pdf
T-CAQI 225—2021 钢制模块化装配污水处理池体技术要求.pdf
GB-T 43411-2023 电子束选区熔化增材制造机床 通用技术条件.pdf
GB-T 7931-2008 1500 11 000 12 000 地形图航空摄影测量外业规范.pdf
GB-T 18305-2016 质量管理体系 汽车生产件及相关服务件组织应用GB-T 19001—2008的特别要求.pdf
GB-T 5975-2006 钢丝绳用压板.pdf
DB43-T 1872-2020 政府网站集约化管理平台运行维护规范 湖南省.pdf
DB46-T 256-2013 白木香输液法通体结香技术规程 海南省.pdf
GB 29384-2012 乙酰甲胺磷原药.pdf
1
/
3
18
评价文档
赞助2.5元 点击下载(569.3 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。