(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210511762.2
(22)申请日 2022.05.10
(71)申请人 北京百度网讯科技有限公司
地址 100085 北京市海淀区上地十街10号
百度大厦二层
(72)发明人 李晓晨 叶方捷 谭荣 郑小裕
(74)专利代理 机构 北京清亦华知识产权代理事
务所(普通 合伙) 11201
专利代理师 单冠飞
(51)Int.Cl.
G06F 9/50(2006.01)
(54)发明名称
资源分配方法和装置
(57)摘要
本公开提供了一种资源分配方法和装置, 涉
及人工智能技术领域, 具体涉及云计算、 机器学
习技术领域。 具体实现方案为: 获取待分配给容
器的模型训练任务的任务参数; 根据模型训练任
务的任务参数, 确定容器的资源配置信息; 根据
资源配置信息, 为容器配置对应的资源。 由此, 结
合模型训练任务, 准确确定出了容器执行该模型
训练任务所需要的资源配置信息, 并基于该资源
配置信息准确为容器分配资源, 实现了容器资源
的自动分配, 提高了容器资源的分配的准确性。
权利要求书3页 说明书11页 附图4页
CN 114816758 A
2022.07.29
CN 114816758 A
1.一种资源分配方法, 包括:
获取待分配给容器的模型训练任务的任务 参数;
根据所述模型训练任务的任务 参数, 确定所述 容器的资源配置信息;
根据所述资源配置信息, 为所述 容器配置对应的资源。
2.根据权利要求1所述的方法, 其中, 所述任务参数包括训练数据集合和机器学习算
法, 所述根据所述模型训练任务的任务 参数, 确定所述 容器的资源配置信息, 包括:
确定所述训练数据集 合所占用的第一存 储空间大小;
根据所述机器学习算法和所述第 一存储空间大小, 确定所述容器待配置的第 二存储空
间大小, 其中, 所述资源配置信息包括所述第二存 储空间大小;
所述根据所述资源配置信息, 为所述 容器配置对应的资源, 包括:
根据所述第二存 储空间大小为所述 容器配置存储空间。
3.根据权利要求1所述的方法, 其中, 所述任务参数包括训练数据集合、 机器学习算法
和预设训练 时长, 所述根据所述模型训练任务的任务参数, 确定所述容器的资源配置信息,
包括:
确定所述训练数据集 合所占用的第一存 储空间大小;
根据所述机器学习算法、 所述第一存储空间大小和所述预设训练时长, 确定所述容器
待配置的处 理器核数, 其中, 所述资源配置信息包括所述处 理器核数;
所述根据所述资源配置信息, 为所述 容器配置对应的资源, 包括:
根据所述处 理器核数为所述 容器配置处理器。
4.根据权利要求2 ‑3中任一项所述的方法, 其中, 所述确定所述训练数据集合所占用的
第一存储空间大小, 包括:
确定所述训练数据集 合中训练数据的数据类型;
根据所述数据类型和所述训练数据集合中训练数据的总数, 确定所述训练数据集合所
占用的第一存 储空间大小。
5.根据权利要求4所述的方法, 其中, 所述根据所述数据类型和所述训练数据集合中训
练数据的总数, 确定所述训练数据集 合所占用的第一存 储空间大小, 包括:
在所述数据类型为第 一数据类型的情况下, 获取所述第 一数据类型的单个训练数据 所
占用的存储空间大小, 其中, 单个所述第一数据类型 的训练数据所占用的存储空间大小固
定;
根据所述存储空间大小和所述训练数据集合中训练数据的总数, 确定所述训练数据集
合所占用的第一存 储空间大小。
6.根据权利要求4所述的方法, 其中, 所述根据所述数据类型和所述训练数据集合中训
练数据的总数, 确定所述训练数据集 合所占用的第一存 储空间大小, 包括:
在所述数据类型为第二数据类型的情况下, 从所述训练数据集合中随机抽取出N个训
练数据, 其中, 单个所述第二数据类型的训练数据所占用的存 储空间大小不固定;
根据所述N个训练数据 各自所占用的存储空间大小, 确定所述N个训练数据所占用的平
均存储空间大小;
根据所述平均存储空间大小和所述训练数据集合中训练数据的总数, 确定所述训练数
据集合所占用的第一存储空间大小, 其中, 所述N为大于1的整 数, 并且小于所述训练数据集权 利 要 求 书 1/3 页
2
CN 114816758 A
2合中所述训练数据的总数。
7.根据权利要求2所述的方法, 其中, 所述根据所述机器学习算法和所述第 一存储空间
大小, 确定所述 容器待配置的第二存 储空间大小, 包括:
获取所述机器学习算法的存 储空间相关参数;
根据所述存储空间相关参数、 所述第一存储空间大小和第一计算函数, 确定所述训练
数据集合在所述机器学习算法下完成所述模型训练任务所需要的存 储空间大小;
将所得到的存 储空间大小作为所述 容器待配置的第二存 储空间大小。
8.根据权利要求3所述的方法, 其中, 所述根据所述机器学习算法、 所述第一存储空间
大小和所述预设训练时长, 确定所述 容器待配置的处 理器核数, 包括:
获取所述机器学习算法的处 理器相关参数;
根据所述预设训练时长、 所述第 一存储空间大小、 所述处理器相关参和第 二计算函数,
确定所述训练数据集合在所述机器学习算法下训练所述预设训练时长所需要的处理器核
数;
将所得到的处 理器核数作为 容器待配置的处 理器核数。
9.一种资源分配装置, 包括:
获取模块, 用于获取待分配给容器的模型训练任务的任务 参数;
确定模块, 用于根据所述模型训练任务的任务 参数, 确定所述 容器的资源配置信息;
配置模块, 用于根据所述资源配置信息, 为所述 容器配置对应的资源。
10.根据权利要求9所述的装置, 其中, 所述任务参数包括训练数据集合和机器学习算
法, 所述确定模块, 包括:
第一确定单 元, 用于确定所述训练数据集 合所占用的第一存 储空间大小;
第二确定单元, 用于根据所述机器学习算法和所述第一存储空间大小, 确定所述容器
待配置的第二存 储空间大小, 其中, 所述资源配置信息包括所述第二存 储空间大小;
所述配置模块, 具体用于: 根据所述第二存 储空间大小为所述 容器配置存储空间。
11.根据权利要求9所述的装置, 其中, 所述任务参数包括训练数据集合、 机器学习算法
和预设训练时长, 所述确定模块, 包括:
第一确定单 元, 用于确定所述训练数据集 合所占用的第一存 储空间大小;
第三确定单元, 用于根据所述机器学习算法、 所述第一存储空间大小和所述预设训练
时长, 确定所述 容器待配置的处 理器核数, 其中, 所述资源配置信息包括所述处 理器核数;
所述配置模块, 具体用于: 根据所述处 理器核数为所述 容器配置处理器。
12.根据权利要求10或1 1中任一项所述的装置, 其中, 所述第一确定单 元, 包括:
第一确定 子单元, 用于确定所述训练数据集 合中训练数据的数据类型;
第二确定子单元, 用于根据所述数据类型和所述训练数据集合中训练数据的总数, 确
定所述训练数据集 合所占用的第一存 储空间大小。
13.根据权利要求12所述的装置, 其中, 所述第二确定 子单元, 具体用于:
在所述数据类型为第 一数据类型的情况下, 获取所述第 一数据类型的单个训练数据 所
占用的存储空间大小, 其中, 单个所述第一数据类型 的训练数据所占用的存储空间大小固
定;
根据所述存储空间大小和所述训练数据集合中训练数据的总数, 确定所述训练数据集权 利 要 求 书 2/3 页
3
CN 114816758 A
3
专利 资源分配方法和装置
文档预览
中文文档
19 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 07:17:53上传分享