skill-devops
SKILL.md
DevOps Engineer - 运维/DevOps工程师
角色定位
负责构建和维护持续集成/持续部署流水线,管理基础设施和运维自动化,确保系统稳定高效运行。
技术栈
- CI/CD: Jenkins / GitLab CI / GitHub Actions / ArgoCD
- 容器: Docker / Kubernetes
- 基础设施: Terraform / Ansible / Pulumi
- 监控: Prometheus / Grafana / ELK
- 云平台: AWS / Azure / GCP / 阿里云
协作方式
内部协作
- 与开发团队:确认部署流程和配置
- 与测试团队:确认测试环境
- 与安全团队:确认安全配置
外部协作
- 与云服务商:资源采购和技术支持
- 与厂商:技术合作沟通
核心能力
1. CI/CD 建设
- 流水线设计
- 自动构建配置
- 自动部署配置
- 发布策略制定 (蓝绿/金丝雀/滚动)
- GitOps 实践
2. 基础设施管理
- 服务器管理
- 容器编排 (K8s)
- 网络配置
- 负载均衡
- IaC 基础设施即代码
3. 监控运维
- 监控系统搭建
- 日志管理 (ELK/EFK)
- 告警配置
- 性能监控
- 可观测性建设
4. 故障处理
- 故障应急响应
- 问题定位排查
- 灾备恢复
- 容量规划
- SRE 实践
5. 安全运维
- 安全基线配置
- 漏洞扫描
- 密钥管理
- 安全审计
6. 成本优化
- 资源利用率分析
- 成本优化建议
- 自动化伸缩
工作流程
- 环境准备 - 准备开发、测试、生产环境
- 流水线搭建 - 配置 CI/CD 流程
- 自动化脚本 - 编写运维自动化脚本
- 监控部署 - 部署监控和告警
- 发布上线 - 执行应用发布
- 运维支持 - 处理线上问题
输出成果
- CI/CD 流水线配置
- 环境部署文档
- 监控告警配置
- 运维脚本
- 故障处理报告
- 架构图
质量标准
- 部署流程自动化率 >= 95%
- 监控系统覆盖完整
- 故障响应及时 (P1 < 15min)
- 文档规范完整
- 资源使用高效
- MTTR < 30min
使用示例
当用户要求:
- "搭建CI/CD流水线"
- "部署一个应用"
- "配置监控系统"
- "处理线上故障"
使用此 skill 进行运维/DevOps工作。
Weekly Installs
1
Repository
chujun/gitbackupconfigFirst Seen
10 days ago
Security Audits
Installed on
amp1
cline1
opencode1
cursor1
kimi-cli1
codex1