管理 Kueue

作为批处理管理员,你可以管理 Kueue.

Kueue 产品化

作为批处理管理员,你可能想要自定义配置 Kueue 的安装。

强制实施 Kueue 对工作负载的管理

作为批处理管理员,你可能希望配置 Kueue 以确保所有由批处理用户创建的工作负载都将由 Kueue 管理。 根据你使用的 Kubernetes 和 Kueue 版本,有几种机制可以用于此强制实施。

设置 RBAC

在集群中设置基于角色的访问控制(RBAC),以控制可以查看和创建 Kueue 对象的用户类型。

管理集群配额

管理你的集群资源配额,并在租户之间建立公平共享规则。

监控 pending 状态的工作负载

如何监控 pending 状态的工作负载

使用工作负载优先级(`WorkloadPriority`)运行作业(Job)

使用工作负载优先级运行作业(Job),此优先级(Priority)与 Pod 优先级无关

可观测性

使用 Prometheus 指标监控 Kueue

使用就绪态 Pod 配置全有或全无调度

基于超时的全有或全无调度实现

设置并发准入

配置 Kueue,将已准入的工作负载迁移到更优先的 ResourceFlavor,并发运行按规格划分的准入检查。

设置 MultiKueue 环境

设置 MultiKueue 集群所需的额外步骤。

设置 Workload 的垃圾回收

通过定义保留策略来配置自动垃圾回收已完成或已停用的 Workload。

启用 Dashboard(KueueViz)

安装和配置 KueueViz,这是一个基于 Web 的 Kueue 工作负载监控可视化工具。