caw-eval
Installation
SKILL.md
CAW Eval
端到端评测 CAW Agent 质量:本地 Mac 作为调度器,dispatch 到远端服务器跑 headless claude (标准 / recipe 评测)或 openclaw agent(弱模型兼容性评测),评分和报告都在本地完成。
Step 0: 环境识别(必做)
[[ "$(hostname)" == *openclaw* ]] && echo "env=openclaw" || echo "env=local"
env=local:继续。确保gcloud auth login已完成、IAP 通道可用。env=openclaw:停止。本 SKILL 是本地调度器,不能在 openclaw 服务器直接跑。 请回到本地 Mac 终端后重新触发。
流程路由
评测三个正交维度: