安全公司报告
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210467947.8 (22)申请日 2022.04.29 (71)申请人 苏州浪潮智能科技有限公司 地址 215100 江苏省苏州市吴中区吴中经 济开发区郭巷街道官浦路1号9幢 (72)发明人 马磊 (74)专利代理 机构 济南诚智商标专利事务所有 限公司 3710 5 专利代理师 黄晓燕 (51)Int.Cl. G06F 9/50(2006.01) G06F 9/48(2006.01) (54)发明名称 一种基于GPU分时复用的工作流调度方法、 设备及存 储介质 (57)摘要 本申请公开了一种基于GPU分时复用的工作 流调度方法、 设备及存储介质, 用以解决现有技 术中GPU资源无法动态调配, 导致性能下降的问 题的技术问题的技术问题。 方法包括: 将集群内 若干节点的全部GPU显存资源划分为若干时间片 段; 创建工作流, 确定完成所述工作流所需要的 工作时间, 并计算完成所述工作流所需要的第一 GPU显存资源; 为所述工作流 分配所述第一GP U显 存资源, 并将分配的所述第一GPU显存资源所对 应的时间片段进行赋值标记, 以提示系统所述第 一GPU显存资源已被占用。 本申请通过上述方法 实现了不会因为周期调用闲时占用GPU以及GPU 显存资源而浪费资源, 能够通过设置GPU分时的 时间片段来有效控制GP U以及GPU显存的调度, 保 证了让业务能够正常高效的运行。 权利要求书2页 说明书6页 附图1页 CN 114780240 A 2022.07.22 CN 114780240 A 1.一种基于GPU分时复用的工作流调度方法, 其特 征在于, 所述方法包括: 将集群内若干节点的全部GPU显存资源划分为若干时间片段; 创建工作流, 确定完成所述工作流所需要的工作时间, 并计算完成所述工作流所需要 的第一GPU显存资源; 为所述工作流分配所述第一GPU显存资源, 并将分配的所述第一GPU显存资源所对应的 时间片段进行 赋值标记, 以提 示系统所述第一GPU显存资源已被占用。 2.根据权利要求1所述的一种基于GPU分时复用的工作流调度方法, 其特征在于, 在所 述将集群内若干节点的全部GPU显存资源划分为若干时间片段之前, 所述方法还 包括: 实时监测集群内若干节点的全部GPU以及GPU显存资源, 并将所述GPU显存资源汇总至 资源池内。 3.根据权利要求1或2所述的一种基于GPU分时复用的工作流调度 方法, 其特征在于, 所 述方法还 包括: 确定所述第一GPU显存资源的利用率; 基于预设利用率数值, 对所述GPU显存资源进行动态再分配。 4.根据权利要求3所述的一种基于GPU分时复用的工作流调度方法, 其特征在于, 所述 基于预设利用率数值, 对所述GPU显存资源进行动态分配, 具体包括: 在所述第一GPU显存资源的利用率低于第一预设利用率数值时, 从所述第一GPU显存资 源划分出第二GPU显存资源; 将所述第二GPU显存资源释放回资源 池。 5.根据权利要求4所述的一种基于GPU分时复用的工作流调度方法, 其特征在于, 所述 方法还包括: 监测是否已成功划分出 所述第二GPU显存资源; 若未成功划分所述第二GPU显存资源, 则分析原因并生成平台告警信息 。 6.根据权利要求3所述的一种基于GPU分时复用的工作流调度方法, 其特征在于, 所述 方法还包括: 在所述第一GPU显存资源的利用率高于第二预设利用率数值时, 从资源池里的GPU资源 中抓取第三GPU显存资源, 并将所述第三GPU显存资源合并至所述第一GPU显存资源中。 7.根据权利要求6所述的一种基于GPU分时复用的工作流调度方法, 其特征在于, 所述 方法还包括: 监测是否已成功从资源 池中抓取第三GPU显存资源; 若未成功从资源池中抓取所述第三GPU资源, 或未将所述第三GPU显存资源合并至所述 第一GPU显存资源中, 则分析原因并生成平台告警信息 。 8.根据权利要求1或2所述的一种基于GPU分时复用的工作流调度方法方法, 其特征在 于, 所述方法还 包括: 接收新建的工作流, 并确定 完成所述 新建的工作流所需要的预 跑周期; 若所述预跑周期与所述第一GPU显存资源的时间片段一致, 则对所述新建的工作流隐 藏所述第一GPU显存资源。 9.一种基于GPU分时复用的工作流调度设备, 其特 征在于, 所述设备包括: 至少一个处 理器; 以及,权 利 要 求 书 1/2 页 2 CN 114780240 A 2与所述至少一个处 理器通信连接的存 储器; 其中, 所述存储器存储有可被所述至少一个处理器执行的指令, 所述指令被所述至少一个处 理器执行, 以使 所述至少一个处理器能够: 将集群内若干节点的全部 GPU显存资源划分为若 干时间片段; 创建工作流, 确定完成所述工作流所需要的工作时间, 并计算完成所述工作流所需要 的第一GPU显存资源; 为所述工作流分配所述第一GPU显存资源, 并将分配的所述第一GPU显存资源所对应的 时间片段进行 赋值标记, 以提 示系统所述第一GPU显存资源已被占用。 10.一种基于GPU分时复用的工作流调度的非易失性计算机存储介质, 存储有计算机可 执行指令, 其特 征在于, 所述计算机可 执行指令设置为: 将集群内若干节点的全部GPU显存资源划分为若干时间片段; 创建工作流, 确定完成所述工作流所需要的工作时间, 并计算完成所述工作流所需要 的第一GPU显存资源; 为所述工作流分配所述第一GPU显存资源, 并将分配的所述第一GPU显存资源所对应的 时间片段进行 赋值标记, 以提 示系统所述第一GPU显存资源已被占用。权 利 要 求 书 2/2 页 3 CN 114780240 A 3
专利 一种基于GPU分时复用的工作流调度方法、设备及存储介质
文档预览
中文文档
10 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共10页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 07:11:14
上传分享
举报
下载
原文档
(392.7 KB)
分享
友情链接
GB-T 38634.4-2020 系统与软件工程 软件测试 第4部分:测试技术.pdf
GB-T 11693-2022 船用法兰焊接座板.pdf
DB43-T 1835-2020 智能轨道快运系统设计规范 湖南省.pdf
设备管理制度.pdf
GB-T 42449-2023 系统与软件工程 功能规模测量 IFPUG方法.pdf
GB-T 28801-2012 气枪.pdf
GB-T 41919-2022 人造石建筑板材.pdf
逐浪大模型:互联网巨头的AI野望.pdf
GB-T 24108-2009 岩土工程仪器可靠性技术要求.pdf
GB-T 8054-2008 计量标准型一次抽样检验程序及表.pdf
DB 31DSJ∕Z 005-2020 公共数据安全分级指南.pdf
GB-T 17639-2023 土工合成材料 长丝纺粘针刺非织造土工布.pdf
GB-T 2694-2018 输电线路铁塔制造技术条件.pdf
GB-T 34131-2023 电力储能用电池管理系统.pdf
奇安信 实战攻防之红队视角下的防御体系突破.pdf
GB-T 11616-2013 同步带传动 节距型号MXL、XXL、XL、L、H、XH和XXH 同步带尺寸.pdf
ISO IEC 20924 2024 Internet of Things (IoT) and digital twin — Vocabulary.pdf
GB-T 24352-2020 饲料加工设备图形符号.pdf
ISO 27001 标准--中英文.pdf
GB-T 22081-xxxx ISO-IEC27002 2022 信息安全技术 信息安全控制(征求意见稿).pdf
1
/
3
10
评价文档
赞助2.5元 点击下载(392.7 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。