k8s-check-fix

Installation
SKILL.md

k8s-check-fix — Kubernetes 集群诊断与安全修复

该工具可以执行 Kubernetes 集群诊断(全面健康检查、Pod 深入排查、Deployment 分析、资源压力检测、事件监控),并且在用户明确批准后执行安全修复操作。

执行原则

  1. 每个 kubectl 命令调用必须设置超时(例如 30 秒)。如果命令在超时内未返回,立即向用户报告“命令执行超时,可能是 API Server 无响应”,并停止当前技能
  2. 任何子命令失败(返回非零退出码或 JSON 错误字段),立即报告错误详情,不要自动重试,并询问用户是否继续。
  3. 如果用户没有明确要求继续,默认停止技能,避免陷入无意义的重试循环。
  4. 禁止连续调用超过 3 个子命令而不给用户反馈。每执行一个命令,必须将结果(哪怕是中间结果)以 Markdown 形式展示给用户。
  5. 如果某个子命令预计耗时超过 10 秒(例如 sweep 在大集群中),必须先向用户发送“正在执行,请稍候...”消息,再调用命令。

触发条件

在以下情况下使用此技能:

  • 用户要求检查、诊断或修复 Kubernetes 集群、节点、Pod 或 Deployment。
  • 用户报告的症状包括:Pod 频繁重启、节点状态 NotReadykubectl 命令执行失败、滚动更新卡住、网络问题等。
  • 用户提供了 kubectl 错误信息,或提到某个资源处于不健康状态。
  • 用户描述模糊,如“我的集群出问题了”或“帮我调试 Kubernetes”。
Related skills

More from ascend/agent-skills

Installs
4
GitHub Stars
14
First Seen
6 days ago