(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210440238.0
(22)申请日 2022.04.25
(71)申请人 云南师范大学
地址 650500 云南省昆明市呈贡区 聚贤街
768号
(72)发明人 郝佳 甘健侯 周菊香 王俊
朱璐瑜
(74)专利代理 机构 昆明人从众知识产权代理有
限公司 5 3204
专利代理师 沈艳尼
(51)Int.Cl.
G06F 9/455(2006.01)
G06F 9/50(2006.01)
(54)发明名称
一种基于Q-learning的虚拟机细粒度资源
自适应管理办 法
(57)摘要
本发明涉及一种基于Q ‑learning的虚拟机
细粒度资源自适应管理办法, 属于虚拟机动态管
理技术领域。 本发明首先利用Linux性能监测工
具实时搜集硬件计数器数据后, 结合LightGBM算
法来预测应用的响应时间是否满足SLO。 当预测
结果超出SLO规定范围时, 则基于强化学习框架
Q‑learning, 来动态调整CPU、 内存、 硬盘、 网络带
宽和末级缓存(Last Level Cache,LLC)这些细
粒度资源。 使得用户应用在满足SL O指标的同时,
还能最大化细粒度资源的使用效率。
权利要求书2页 说明书8页 附图2页
CN 114691303 A
2022.07.01
CN 114691303 A
1.一种基于Q ‑learning的虚拟机细粒度资源自适应管理办法, 其特 征在于:
Step1: 根据用户的需求 为其预分配资源;
Step2: 用L inux性能监测工具获取硬件计数器数据;
Step3: 结合所获取到的硬件计数器数据, 构建LightGBM模型来预测用户所部属应用的
响应时间T;
Step4: 利用Q ‑learning做出资源调整的决策;
Step5: 利用cgroup、 I ntel CAT和HTB实施各类资源的调度。
2.根据权利要求1所述的基于Q ‑learning的虚拟机细粒度资源自适应管理办法, 其特
征在于, 所述Step1具体为:
记X={xCPU,xmemory,xI/O,xnetwork,xLLC}为某用户所请求的虚拟 机资源需求矩阵, 其中xi(i
∈{CPU,memory,I/O,netw ork,LLC})表示用户对第i种资源的需求;
记Y={yCPU,ymemory,yI/O,ynetwork,yLLC}为物理服 务器上的资源矩阵;
利用公式(1)所示的BestFit(X,Y)函数来找到最 合适的资源预分配方案;
其中, wi为资源的权重值, 其度量了第i(i∈{CPU,memory,I/O,network,LLC})种资源的
稀缺性; wi的值越大, 表示该资源越稀少, BestFit(X,Y)的值越小, 表明当前物理主机的资
源浪费越少;
因此, 当有p台备选物理主机时, 通过公式(1)的计算, 选择在BestFit(X,Y)值最小的物
理主机上部署用户的虚拟机 。
3.根据权利要求1所述的基于Q ‑learning的虚拟机细粒度资源自适应管理办法, 其特
征在于, 所述Step2具体为: 利用Linux监测命令vmstat和性能监测工具perf来实时记录硬
件计数器数据。
4.根据权利要求1所述的基于Q ‑learning的虚拟机细粒度资源自适应管理办法, 其特
征在于, 所述Step3具体为:
Step3.1: 初始化LightGBM模型为fLight GBM=0, 所有硬件计数器特征集用集合Z来表示,
而某一个具体的特征用zi(i∈{swap,free,buff, …,LLC_stores})来表示, 即Z={z1,z2,
z3,…};
训练数据集D中共有N条数据实例, 每一条数据实例包括了用户的资源需求数据X和反
映资源使用量的硬件计数器数据Z, 同时也包括了用户的响应时间T, 即: 第n(i∈{1,2, …,
N})条数据实例的形式为Dn={xCPU,xmemory,…,z1,z2,…T};
Step3.2: 用fLight GBM依次预测数据集Dn中所有数据实例的响应时间, 并记 录相应的预测
结果梯度值 为gn(n∈{1,2, …,N});
第n(i∈{1,2, …,N})条数据实例响应时间的预测结果 为fLight GBM(Tn);
随后, 利用公式(2)计算该条数据 实例真实的响应时间Tn和预测结果fLight GBM(Tn)之间
的均方误差, 并记相应梯度为
Ln=(Tn‑fLight GBM(Tn))2 (2)Step3.3: 将D中所有数据按照梯度值降序排列后, 利用
单边梯度采样, 选出 前a%条数据实例构成集 合A;
从剩余的|D ‑a%|条数据中, 任意挑选b%条 数据实例构成集 合B;权 利 要 求 书 1/2 页
2
CN 114691303 A
2利用公式(3)依次计算集合Z 中各特征值的分割值Vj(d)(j∈Z), 并选举具有最大V值的
点d作为当前模型fLight GBM的最优分割点:
式中, Al和Ar分别表示集合A中小于和大于分割点d的集合, Bl和Br分别表示集合B中小于
和大于分割点d的集合,
和
分别表示训练数据集中大于和小于等于分割点d的数
量;
重复该过程m次, 并将相应的最优分割点聚合后, 得到模型
Tm与
fLight GBM构成了当前 所构建的L ightGBM模型, 即: fLight GBM=fLight GBM+Tm;
Step3.4: 重复Step3.2和Step3.3共M次, 得到一个完整的LightGBM模型, 利用该模型所
预测的第n条数据实例的响应时间为fLight GBM(Tn), 若该时间的值超出了SLO的规定范围, 则
利用Step4所描述的Q ‑learning算法来做出资源调整的决策; 否则, 重复执行Step2, 继续监
测虚拟机的资源使用情况。
5.根据权利要求1所述的基于Q ‑learning的虚拟机细粒度资源自适应管理办法, 其特
征在于, 所述Step4具体为:
Step4.1: 初 始化当前虚拟机所处状态s= s0, 随机选取并执行动作act, 初 始化值函数为
Q(s,act)=0;
Step4.2: 根据公式(4)计算此时的奖励值r:
并利用∈贪心策略π∈来选取下一步所要执行的资源调整方案, 即act ′=π∈(s), 同时记
录转移后的状态为s ′;
Step4.3: 利用公式(5)来更新 值函数Q(s,act), 并将该值存 储起来;
Q(s,act)= Q(s,act)+0.1*(r+0.8*Q(s ′,act′)‑Q(s,act) ) (5)
Step4.4: 重复Step 4.2和Step 4.3, 直至应用的响应时间T在SLO的规定范围内, 此时, 选
取最大值Q(s,act)所对应的动作来作为虚拟机的资源调整策略, 即: π(s)=argmaxQ(s,
act)。权 利 要 求 书 2/2 页
3
CN 114691303 A
3
专利 一种基于Q-learning的虚拟机细粒度资源自适应管理办法
文档预览
中文文档
13 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 07:11:18上传分享