安全公司报告
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210467947.8 (22)申请日 2022.04.29 (71)申请人 苏州浪潮智能科技有限公司 地址 215100 江苏省苏州市吴中区吴中经 济开发区郭巷街道官浦路1号9幢 (72)发明人 马磊  (74)专利代理 机构 济南诚智商标专利事务所有 限公司 3710 5 专利代理师 黄晓燕 (51)Int.Cl. G06F 9/50(2006.01) G06F 9/48(2006.01) (54)发明名称 一种基于GPU分时复用的工作流调度方法、 设备及存 储介质 (57)摘要 本申请公开了一种基于GPU分时复用的工作 流调度方法、 设备及存储介质, 用以解决现有技 术中GPU资源无法动态调配, 导致性能下降的问 题的技术问题的技术问题。 方法包括: 将集群内 若干节点的全部GPU显存资源划分为若干时间片 段; 创建工作流, 确定完成所述工作流所需要的 工作时间, 并计算完成所述工作流所需要的第一 GPU显存资源; 为所述工作流 分配所述第一GP U显 存资源, 并将分配的所述第一GPU显存资源所对 应的时间片段进行赋值标记, 以提示系统所述第 一GPU显存资源已被占用。 本申请通过上述方法 实现了不会因为周期调用闲时占用GPU以及GPU 显存资源而浪费资源, 能够通过设置GPU分时的 时间片段来有效控制GP U以及GPU显存的调度, 保 证了让业务能够正常高效的运行。 权利要求书2页 说明书6页 附图1页 CN 114780240 A 2022.07.22 CN 114780240 A 1.一种基于GPU分时复用的工作流调度方法, 其特 征在于, 所述方法包括: 将集群内若干节点的全部GPU显存资源划分为若干时间片段; 创建工作流, 确定完成所述工作流所需要的工作时间, 并计算完成所述工作流所需要 的第一GPU显存资源; 为所述工作流分配所述第一GPU显存资源, 并将分配的所述第一GPU显存资源所对应的 时间片段进行 赋值标记, 以提 示系统所述第一GPU显存资源已被占用。 2.根据权利要求1所述的一种基于GPU分时复用的工作流调度方法, 其特征在于, 在所 述将集群内若干节点的全部GPU显存资源划分为若干时间片段之前, 所述方法还 包括: 实时监测集群内若干节点的全部GPU以及GPU显存资源, 并将所述GPU显存资源汇总至 资源池内。 3.根据权利要求1或2所述的一种基于GPU分时复用的工作流调度 方法, 其特征在于, 所 述方法还 包括: 确定所述第一GPU显存资源的利用率; 基于预设利用率数值, 对所述GPU显存资源进行动态再分配。 4.根据权利要求3所述的一种基于GPU分时复用的工作流调度方法, 其特征在于, 所述 基于预设利用率数值, 对所述GPU显存资源进行动态分配, 具体包括: 在所述第一GPU显存资源的利用率低于第一预设利用率数值时, 从所述第一GPU显存资 源划分出第二GPU显存资源; 将所述第二GPU显存资源释放回资源 池。 5.根据权利要求4所述的一种基于GPU分时复用的工作流调度方法, 其特征在于, 所述 方法还包括: 监测是否已成功划分出 所述第二GPU显存资源; 若未成功划分所述第二GPU显存资源, 则分析原因并生成平台告警信息 。 6.根据权利要求3所述的一种基于GPU分时复用的工作流调度方法, 其特征在于, 所述 方法还包括: 在所述第一GPU显存资源的利用率高于第二预设利用率数值时, 从资源池里的GPU资源 中抓取第三GPU显存资源, 并将所述第三GPU显存资源合并至所述第一GPU显存资源中。 7.根据权利要求6所述的一种基于GPU分时复用的工作流调度方法, 其特征在于, 所述 方法还包括: 监测是否已成功从资源 池中抓取第三GPU显存资源; 若未成功从资源池中抓取所述第三GPU资源, 或未将所述第三GPU显存资源合并至所述 第一GPU显存资源中, 则分析原因并生成平台告警信息 。 8.根据权利要求1或2所述的一种基于GPU分时复用的工作流调度方法方法, 其特征在 于, 所述方法还 包括: 接收新建的工作流, 并确定 完成所述 新建的工作流所需要的预 跑周期; 若所述预跑周期与所述第一GPU显存资源的时间片段一致, 则对所述新建的工作流隐 藏所述第一GPU显存资源。 9.一种基于GPU分时复用的工作流调度设备, 其特 征在于, 所述设备包括: 至少一个处 理器; 以及,权 利 要 求 书 1/2 页 2 CN 114780240 A 2与所述至少一个处 理器通信连接的存 储器; 其中, 所述存储器存储有可被所述至少一个处理器执行的指令, 所述指令被所述至少一个处 理器执行, 以使 所述至少一个处理器能够: 将集群内若干节点的全部 GPU显存资源划分为若 干时间片段; 创建工作流, 确定完成所述工作流所需要的工作时间, 并计算完成所述工作流所需要 的第一GPU显存资源; 为所述工作流分配所述第一GPU显存资源, 并将分配的所述第一GPU显存资源所对应的 时间片段进行 赋值标记, 以提 示系统所述第一GPU显存资源已被占用。 10.一种基于GPU分时复用的工作流调度的非易失性计算机存储介质, 存储有计算机可 执行指令, 其特 征在于, 所述计算机可 执行指令设置为: 将集群内若干节点的全部GPU显存资源划分为若干时间片段; 创建工作流, 确定完成所述工作流所需要的工作时间, 并计算完成所述工作流所需要 的第一GPU显存资源; 为所述工作流分配所述第一GPU显存资源, 并将分配的所述第一GPU显存资源所对应的 时间片段进行 赋值标记, 以提 示系统所述第一GPU显存资源已被占用。权 利 要 求 书 2/2 页 3 CN 114780240 A 3

.PDF文档 专利 一种基于GPU分时复用的工作流调度方法、设备及存储介质

文档预览
中文文档 10 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共10页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于GPU分时复用的工作流调度方法、设备及存储介质 第 1 页 专利 一种基于GPU分时复用的工作流调度方法、设备及存储介质 第 2 页 专利 一种基于GPU分时复用的工作流调度方法、设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 07:11:14上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。