浅谈 K8S QoS(服务质量等级) In 世界杯澳大利亚 @2025-10-26 02:32:19

QoS(Quality of Service) 简介QoS(Quality of Service),大部分译为 “服务质量等级”,又译作 “服务质量保证”,是作用在 Pod 上的一个配置,当 Kubernetes 创建一个 Pod 时,它就会给这个 Pod 分配一个 QoS 等级,可以是以下等级之一:

Guaranteed:Pod 中每个容器都必须有内存/CPU 限制和请求,而且值必须相等。如果一个容器只指明limit而未设定request,则request的值等于limit值。Burstable:Pod 至少有一个容器有内存或者 CPU 请求且不满足 Guarantee 等级的要求,即内存/CPU 的值设置的不同。BestEffort:容器必须没有任何内存或者 CPU 的限制或请求。该配置不是通过一个配置项来配置的,而是通过配置 CPU/MEM的 limits 与 requests 值的大小来确认服务质量等级。

下面是 Guaranteed 例子:

代码语言:javascript代码运行次数:0运行复制 spec:

containers:

- name: demo

image: mritd/demo

resources:

limits:

cpu: 100m

memory: 100Mi

requests:

cpu: 100m

memory: 100Mi

ports:

- containerPort: 80下面是 Burstable 例子:

代码语言:javascript代码运行次数:0运行复制 spec:

containers:

- name: demo

image: mritd/demo

resources:

limits:

cpu: 100m

memory: 100Mi

requests:

cpu: 10m

memory: 10Mi

ports:

- containerPort: 80下面是 BestEffort 例子:

代码语言:javascript代码运行次数:0运行复制 spec:

containers:

- name: demo

image: mritd/demo

ports:

- containerPort: 80资源限制 Limits 和 资源需求 Requests对于CPU:如果pod中服务使用CPU超过设置的 limits,pod不会被kill掉但会被限制。如果没有设置limits,pod可以使用全部空闲的cpu资源。

对于内存:当一个pod使用内存超过了设置的 limits,pod中 container 的进程会被 kernel 因OOM kill掉。当container因为OOM被kill掉时,系统倾向于在其原所在的机器上重启该container或其他重新创建一个pod。

下面是三个资源限制,作用域在不同点上针对 Node 节点资源预留,在 kubelet 组件中配置代码语言:javascript代码运行次数:0运行复制# 下面配置根据实际情况调整

--system-reserved=cpu=500m,memory=1.5Gi \

--eviction-hard=memory.available<1.5Gi,nodefs.available<20Gi,imagefs.available<15Gi \

--eviction-soft=memory.available<2Gi,nodefs.available<25Gi,imagefs.available<10Gi \

--eviction-soft-grace-period=memory.available=2m,nodefs.available=2m,imagefs.available=2m \

--eviction-max-pod-grace-period=30 \

--eviction-minimum-reclaim=memory.available=200Mi,nodefs.available=5Gi,imagefs.available=5Gi针对 namespace 限制配置代码语言:javascript代码运行次数:0运行复制apiVersion: "v1"

kind: "LimitRange"

metadata:

name: "test-resource-limits"

namespace: test

spec:

limits:

- type: "Pod"

max:

cpu: "2"

memory: "2Gi"

min:

cpu: "30m"

memory: "50Mi"

- type: "Container"

max:

cpu: "2"

memory: "2Gi"

min:

cpu: "30m"

memory: "50Mi"

default:

cpu: "300m"

memory: "600Mi"

defaultRequest:

cpu: "30m"

memory: "50Mi"

maxLimitRequestRatio:

cpu: "30"针对 Pod 限制,可以通过 Deployment 配置代码语言:javascript代码运行次数:0运行复制apiVersion: apps/v1beta1

kind: Deployment

metadata:

name: demo-deployment

spec:

replicas: 1

template:

metadata:

annotations:

sidecar.istio.io/inject: "false"

labels:

app: demo

spec:

containers:

- name: demo

image: mritd/demo

resources:

limits:

cpu: 100m

memory: 100Mi

requests:

cpu: 10m

memory: 10Mi

ports:

- containerPort: 80QoS 优先级三种 QoS 优先级,从高到低(从左往右)

Guaranteed --> Burstable --> BestEffort

Kubernetes 资源回收策略Kubernetes 资源回收策略:当集群监控到 node 节点内存或者CPU资源耗尽时,为了保护node正常工作,就会启动资源回收策略,通过驱逐节点上Pod来减少资源占用。

三种 QoS 策略被驱逐优先级,从高到低(从左往右)

BestEffort --> Burstable --> Guaranteed

使用建议如果资源充足,可以将 pod QoS 设置为 Guaranteed不是很关键的服务 pod QoS 设置为 Burstable 或者 BestEffort。比如 filebeat、logstash、fluentd等建议:k8s 安装时,建议把 Swap 关闭,虽然 Swap 可以解决内存不足问题,但当内存不足使用Swap时,系统负载会出现过高,原因是 swap 大量 占用磁盘IO。

参考链接https://jimmysong.io/kubernetes-handbook/concepts/qos.htmlhttp://dockone.io/article/2592

快手上怎么唱歌?零基础也能轻松上手的详细教程
第一次性生活要注意什么