安全公司报告
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210440238.0 (22)申请日 2022.04.25 (71)申请人 云南师范大学 地址 650500 云南省昆明市呈贡区 聚贤街 768号 (72)发明人 郝佳 甘健侯 周菊香 王俊  朱璐瑜  (74)专利代理 机构 昆明人从众知识产权代理有 限公司 5 3204 专利代理师 沈艳尼 (51)Int.Cl. G06F 9/455(2006.01) G06F 9/50(2006.01) (54)发明名称 一种基于Q-learning的虚拟机细粒度资源 自适应管理办 法 (57)摘要 本发明涉及一种基于Q ‑learning的虚拟机 细粒度资源自适应管理办法, 属于虚拟机动态管 理技术领域。 本发明首先利用Linux性能监测工 具实时搜集硬件计数器数据后, 结合LightGBM算 法来预测应用的响应时间是否满足SLO。 当预测 结果超出SLO规定范围时, 则基于强化学习框架 Q‑learning, 来动态调整CPU、 内存、 硬盘、 网络带 宽和末级缓存(Last  Level Cache,LLC)这些细 粒度资源。 使得用户应用在满足SL O指标的同时, 还能最大化细粒度资源的使用效率。 权利要求书2页 说明书8页 附图2页 CN 114691303 A 2022.07.01 CN 114691303 A 1.一种基于Q ‑learning的虚拟机细粒度资源自适应管理办法, 其特 征在于: Step1: 根据用户的需求 为其预分配资源; Step2: 用L inux性能监测工具获取硬件计数器数据; Step3: 结合所获取到的硬件计数器数据, 构建LightGBM模型来预测用户所部属应用的 响应时间T; Step4: 利用Q ‑learning做出资源调整的决策; Step5: 利用cgroup、 I ntel CAT和HTB实施各类资源的调度。 2.根据权利要求1所述的基于Q ‑learning的虚拟机细粒度资源自适应管理办法, 其特 征在于, 所述Step1具体为: 记X={xCPU,xmemory,xI/O,xnetwork,xLLC}为某用户所请求的虚拟 机资源需求矩阵, 其中xi(i ∈{CPU,memory,I/O,netw ork,LLC})表示用户对第i种资源的需求; 记Y={yCPU,ymemory,yI/O,ynetwork,yLLC}为物理服 务器上的资源矩阵; 利用公式(1)所示的BestFit(X,Y)函数来找到最 合适的资源预分配方案; 其中, wi为资源的权重值, 其度量了第i(i∈{CPU,memory,I/O,network,LLC})种资源的 稀缺性; wi的值越大, 表示该资源越稀少, BestFit(X,Y)的值越小, 表明当前物理主机的资 源浪费越少; 因此, 当有p台备选物理主机时, 通过公式(1)的计算, 选择在BestFit(X,Y)值最小的物 理主机上部署用户的虚拟机 。 3.根据权利要求1所述的基于Q ‑learning的虚拟机细粒度资源自适应管理办法, 其特 征在于, 所述Step2具体为: 利用Linux监测命令vmstat和性能监测工具perf来实时记录硬 件计数器数据。 4.根据权利要求1所述的基于Q ‑learning的虚拟机细粒度资源自适应管理办法, 其特 征在于, 所述Step3具体为: Step3.1: 初始化LightGBM模型为fLight GBM=0, 所有硬件计数器特征集用集合Z来表示, 而某一个具体的特征用zi(i∈{swap,free,buff, …,LLC_stores})来表示, 即Z={z1,z2, z3,…}; 训练数据集D中共有N条数据实例, 每一条数据实例包括了用户的资源需求数据X和反 映资源使用量的硬件计数器数据Z, 同时也包括了用户的响应时间T, 即: 第n(i∈{1,2, …, N})条数据实例的形式为Dn={xCPU,xmemory,…,z1,z2,…T}; Step3.2: 用fLight GBM依次预测数据集Dn中所有数据实例的响应时间, 并记 录相应的预测 结果梯度值 为gn(n∈{1,2, …,N}); 第n(i∈{1,2, …,N})条数据实例响应时间的预测结果 为fLight GBM(Tn); 随后, 利用公式(2)计算该条数据 实例真实的响应时间Tn和预测结果fLight GBM(Tn)之间 的均方误差, 并记相应梯度为 Ln=(Tn‑fLight GBM(Tn))2    (2)Step3.3: 将D中所有数据按照梯度值降序排列后, 利用 单边梯度采样, 选出 前a%条数据实例构成集 合A; 从剩余的|D ‑a%|条数据中, 任意挑选b%条 数据实例构成集 合B;权 利 要 求 书 1/2 页 2 CN 114691303 A 2利用公式(3)依次计算集合Z 中各特征值的分割值Vj(d)(j∈Z), 并选举具有最大V值的 点d作为当前模型fLight GBM的最优分割点: 式中, Al和Ar分别表示集合A中小于和大于分割点d的集合, Bl和Br分别表示集合B中小于 和大于分割点d的集合, 和 分别表示训练数据集中大于和小于等于分割点d的数 量; 重复该过程m次, 并将相应的最优分割点聚合后, 得到模型 Tm与 fLight GBM构成了当前 所构建的L ightGBM模型, 即: fLight GBM=fLight GBM+Tm; Step3.4: 重复Step3.2和Step3.3共M次, 得到一个完整的LightGBM模型, 利用该模型所 预测的第n条数据实例的响应时间为fLight GBM(Tn), 若该时间的值超出了SLO的规定范围, 则 利用Step4所描述的Q ‑learning算法来做出资源调整的决策; 否则, 重复执行Step2, 继续监 测虚拟机的资源使用情况。 5.根据权利要求1所述的基于Q ‑learning的虚拟机细粒度资源自适应管理办法, 其特 征在于, 所述Step4具体为: Step4.1: 初 始化当前虚拟机所处状态s= s0, 随机选取并执行动作act, 初 始化值函数为 Q(s,act)=0; Step4.2: 根据公式(4)计算此时的奖励值r: 并利用∈贪心策略π∈来选取下一步所要执行的资源调整方案, 即act ′=π∈(s), 同时记 录转移后的状态为s ′; Step4.3: 利用公式(5)来更新 值函数Q(s,act), 并将该值存 储起来; Q(s,act)= Q(s,act)+0.1*(r+0.8*Q(s ′,act′)‑Q(s,act) )    (5) Step4.4: 重复Step 4.2和Step 4.3, 直至应用的响应时间T在SLO的规定范围内, 此时, 选 取最大值Q(s,act)所对应的动作来作为虚拟机的资源调整策略, 即: π(s)=argmaxQ(s, act)。权 利 要 求 书 2/2 页 3 CN 114691303 A 3

.PDF文档 专利 一种基于Q-learning的虚拟机细粒度资源自适应管理办法

文档预览
中文文档 13 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于Q-learning的虚拟机细粒度资源自适应管理办法 第 1 页 专利 一种基于Q-learning的虚拟机细粒度资源自适应管理办法 第 2 页 专利 一种基于Q-learning的虚拟机细粒度资源自适应管理办法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 07:11:18上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。