“新质生产力”是什么?绿色发展是高质量发展的底色,新质生产力本身就是绿色生产力。
作为数字经济的“底座”,数据中心是新型基础设施节能降耗的关键环节,如何建设下一代绿色高效数据中心一直是产业界的焦点。银河麒麟云底座操作系统结合云场景,从提升数据中心资源利用率、优化系统级能耗、提高系统整体性能三个方向入手进行技术突破,促进降碳增效,推动数据中心绿色发展。
在云场景中,在线业务需要实时处理数据和响应请求,通常需要较多的系统资源;而离线业务虽然需要处理大规模数据,但由于不需要较高要求的处理性能和响应,因此通常对系统资源的要求相对较少。
在离线混部技术利用在线业务和离线业务对资源需求互补的特性,将两种业务部署在同一台服务器上,使得系统资源的利用率提高。相关调研显示,CPU分组动态调频技术可以通过调节CPU core的频率来间接调节服务器的整机功耗。麒麟软件尝试将该技术与在离线混部技术相结合,积极探索绿色节能解决方案。
rubik是一个在离线混部引擎,它基于原生的kubernetes接口进行能力扩展,支持CPU、内存抢占,弹性限流,io权重控制等特性,但尚未涉足节约整机功耗方面。麒麟软件尝试将CPU分组动态调频融入rubik中,探索在离线混部技术与功耗节约的结合。
麒麟软件在rubik中添加power manage子系统,用于对新创建的pod进行频率限制。该组件利用CPU分组接口,定义高频组和低频组。当新建pod时,将高优先级pod绑定的CPU 核分配到高频组中,使其获得更高的的频率资源。该子系统与rubik的关系图1所示:
图1 rubik与power manage功能关系示例
以下实验简单验证了在power manage启用时的效果:
使用112个CPU的服务器,设置一个高频组和一个低频组。power manage启用时,高频组频率区间为[3400,3400],低频组频率区间为[0,2600]。设置112个100%CPU使用率的负载,各个负载独立绑核,负载为sysbench素数计算,CPU按不同比例分配给高低频率区间,实验结果如图2所示:
图2 高频组CPU数量与整机功耗关系
经实验简单验证,启用power manage功能可以有效降低服务器整机功耗,而负载的性能折损仅与CPU降低的频率成正相关。
目前多个研究表明,当前全球数据中心用户集群的平均 CPU 利用率低于 20%,存在巨大的资源浪费。结合上述实验结果,若启用power manage,将其余80%未充分利用的CPU纳入低频组管理,可以节约20%以上的整机功耗。如图3所示:
图3 80%CPU纳入低频组管理效果示意图
在rubik中引入CPU分组动态调频是麒麟软件将在离线混部技术与节约服务器整机功耗结合的一次尝试。通过为pod根据优先级分配不同频率的CPU,可以有效降低服务器在运行时的整机功耗。未来,麒麟软件将带来更多基于国产CPU动态功耗管理技术,为数据中心绿色节能增添技术助力。
通讯员 | 魏玉成
来 源 | 服务器研发部
审 核 | 市场与政府事务部