更新ID(KYUA-202412-1165)
- 更新简述:
- 优化 cgroup 在 percpu 上未及时释放占用内存的问题
- 影响操作系统版本:
- 银河麒麟高级服务器操作系统 V10 SP3 2403
银河麒麟高级服务器操作系统 V10 SP3 2303
银河麒麟高级服务器操作系统 V10 SP2
银河麒麟高级服务器操作系统 V10 SP1
- 更新类型:
- 功能增强
- 发布时间:
- 2024-12-16
- 更新描述:
- 影响软件详情(产品名称 对应架构 软件包 修复版本)
银河麒麟高级服务器操作系统 V10 SP3 2403 loongarch64 kernel 4.19.90-89.18.v2401.a.ky10
银河麒麟高级服务器操作系统 V10 SP3 2403 aarch64,x86_64 kernel 4.19.90-89.18.v2401.ky10
银河麒麟高级服务器操作系统 V10 SP3 2303 aarch64,x86_64,loongarch64 kernel 4.19.90-52.40.v2207
银河麒麟高级服务器操作系统v10 sp2 aarch64;x86_64 kernel 4.19.90-25.44.v2101
银河麒麟高级服务器操作系统v10 sp1 aarch64;x86_64;mips kernel 4.19.90-23.49.v2101
详细介绍
问题简述:
系统中在频繁进行memory cgroup删除和建立时,系统中的percpu内存占用会持续升高。
1.问题复现方法:
增加系统中进行cgroup建立和删除操作的业务量,比如容器大量的建立和删除、k8s节点的大量建立和删除以及远程登录建立和删除等。在业务量进行一段时间后,使用 cat /proc/cgroups 命令查看系统中memory cgroup的数量是否增长,使用cat /proc/meminfo | grep Percpu 命令查看系统的percpu内存是否增长。
2.问题分析结果:
在频繁进行memory cgroup组建立和删除的场景下,会出现大量待销毁状态(dying)的cgroup的情况。内核中的cgroup使用了percpu变量区分不同CPU下的状态变化,随着待销毁的cgroup数量的增多,percpu内存占用也会逐渐增多。
3.补丁及下载地址:
补丁及下载地址
从软件仓库更新
4、修复和更新方法
需要更新内核到最新版本。
更新方法(用root权限执行以下命令):
yum update kernel