skill-evaluator

Installation

SKILL.md

Skill Evaluator

系统性地评估、对比、推荐、搜索和安装 AI agent skills 的完整流程指南。

参考文件

本 skill 依赖以下参考文件，按需读取：

references/reference.md → 安全评估检查清单（威胁分类、攻击模式、审计清单、评分标准）
references/patterns.md → 工具限制与绕过策略、常见陷阱、安装最佳实践
references/examples.md → 完整评估案例（markitdown 对比 + fallback 策略演示）

关键：多个常用工具存在限制，在阶段 3 读取源码前务必查阅 references/patterns.md 中的绕过策略。

核心流程

整个流程分为四个阶段，按顺序执行：

搜索候选 → 信息收集 → 安全评估 → 对比推荐与安装

阶段 1：搜索候选

1.0 前置检查：本地已安装技能

先检查本地：执行 ls ~/.agents/skills/ 和 ls ~/.hermes/skills/，查看用户是否已安装同类技能
如果已安装：直接读取已安装的 SKILL.md，跳过搜索和评估流程，直接进入对比或告知用户

1.1 多源并行搜索

同时发起两个搜索，不等彼此，以最快找到候选：

Skills.sh（全球生态，社区验证多）：
```
bunx skills find [关键词]
```
注意：经常超时（60s+）。Agent 的 shell/terminal 工具自带超时机制，并行发起 SkillHub 搜索即可，谁先完成用谁的结果。
SkillHub（中国优化，速度快，中文技能多）：
```
skillhub search [关键词]
```

1.2 记录候选列表

对每个候选 skill，记录：名称（owner/repo@skill-name）、安装量、来源（skills.sh / SkillHub）、GitHub 仓库 URL（从 owner/repo 直接推导：https://github.com/owner/repo）。

1.3 快速过滤

过滤条件	阈值	理由
安装量	< 20	太低可能不可靠或缺乏社区验证
最近提交	> 4 个月	大概率已停止维护
Agent Trust Hub	Fail	明确安全问题，立即拒绝

过滤后保留 2-5 个候选进入深度评估。 如果过滤后只剩 1 个，同时搜索替代方案对比。

阶段 2：信息收集

此阶段所有操作应并行执行，以提高效率。

2.1 功能详情与仓库活跃度

从技能名字 owner/repo@skill-name 直接定位 GitHub 仓库：https://github.com/{owner}/{repo}

关注点：

Stars/Forks/Issues 数量（社区关注度）
支持的文件格式/功能范围
License 类型
依赖项和集成方式

2.2 更新频率

调用 GitHub API：https://api.github.com/repos/{owner}/{repo}/commits?per_page=5

从 commit.author.date 判断最近一次提交时间和提交间隔。详见 references/patterns.md 中的 GitHub API 元数据获取。

注意：如果 skill 是 SkillHub 独占（无公开 GitHub 仓库），更新频率和活跃度指标标记为 N/A，在可信度评级中相应降级。

2.3 信息汇总表

指标	Skill A	Skill B	Skill C
安装量
Stars
最近提交
更新频率
Agent Trust Hub
Socket
Snyk

阶段 3：安全评估（核心）

此阶段最为关键，决定 skill 是否可安全使用。

3.1 读取源码

策略：根据来源选择最直接的路径。

来自 skills.sh 的技能：直接用 git clone --depth 1 克隆 GitHub 仓库（owner/repo 已知），避免 web_extract 被拦截：
```
TMPDIR=$(mktemp -d) && git clone --depth 1 "https://github.com/{owner}/{repo}.git" "$TMPDIR"
```
克隆后查找 SKILL.md，常见目录结构（按优先级）：.agents/skills/{name}/ → .claude/skills/{name}/ → .opencode/skills/{name}/ → skills/{name}/ → 根目录。

来自 SkillHub 的技能：默认下载到临时目录：

TMPDIR="/tmp/skillhub-tmp-$$" && mkdir -p "$TMPDIR"
skillhub --dir "$TMPDIR" install <slug>

读取 SKILL.md 后，如果它引用了其他文件（如 reference.md、scripts/ 下的脚本），一并读取。完成后清理临时目录。

3.2 检查硬编码路径

SkillHub 下载的 skill 常包含作者本机的硬编码路径。审计时必须检查 SKILL.md 和 scripts/ 中是否有 find /mnt/c/Users/...、/root/.openclaw 等路径。

如果路径硬编码为作者机器特有路径，在报告中注明"路径需适配当前环境"，不建议直接安装。

3.3 安全审计

逐行阅读 SKILL.md，按照 references/reference.md 中的检查清单逐项审计。 以下是要点摘要：

致命红线（立即拒绝）：

Base64 编码的隐藏指令
引导 agent 读取并外传环境变量（如 $ANTHROPIC_API_KEY）
附带可执行文件且功能与 skill 声称不符
条件激活逻辑（"当 X 条件满足时执行 Y"，Y 与 skill 功能无关）

高风险（需明确警告用户）：

API Key 通过 CLI 参数传递（会出现在 shell 历史和 ps 输出中）
第三方插件/扩展系统默认启用且无验证
向外部服务发送文档内容但未明确告知用户

中风险（需提醒用户注意）：

文件路径未做穿越防护（../../ 攻击）
输出文件覆盖已有内容无确认
递归目录遍历可能暴露意外文件

平台审计结果（辅助验证）： 结合 GitHub 仓库 README、skills.sh 安装页面或其他渠道获取的 Agent Trust Hub / Socket / Snyk 评级，与自主审计结果交叉验证。如自主审计与平台结果冲突，以自主审计为准。

3.4 仓库信誉检查

维护者身份：个人/组织/官方（如 anthropics、vercel-labs 更可信）
提交验证状态：是否有 Verified commits（GPG 签名）
Issue/PR 响应：维护者是否积极回应社区反馈
安全修复历史：是否有过漏洞修复记录

3.5 安全评分

对每个 skill 给出安全评分（1-10 分）。评分维度、分数段含义详见 references/reference.md 的"安全评分标准"部分。核心维度：Prompt 注入、凭证处理、代码执行、数据外泄、文件系统安全、插件系统、混淆内容。

阶段 4：对比推荐与安装

4.1 生成综合对比表

合并所有阶段信息，生成单一综合对比表：

指标	Skill A	Skill B	Skill C
安装量
Stars
更新频率
Agent Trust Hub
Socket
Snyk
自主安全评分
功能定位
核心风险点

4.2 分级推荐

安全优先型： 推荐安全评分最高、Agent Trust Hub 通过、有完整安全文档的 skill。

功能优先型： 推荐功能最全、更新最活跃、社区验证最多的 skill。

组合安装： 同时安装两个 skills，日常用一个，安全参考用另一个。

4.3 执行安装

用户确认后，根据技能来源选择正确的安装命令。完整命令速查和注意事项详见 references/patterns.md。

Skills.sh 技能：

bunx skills add {owner}/{repo}@{skill-name} -g -y

SkillHub 技能：

skillhub --dir ~/.hermes/skills/ install {slug}

注意 --dir 是全局选项，必须放在子命令 install 之前。

4.4 多 Agent 兼容处理

bunx skills add 内置 --agent 参数，支持 40+ 个 Agent。

安装策略：

从系统提示词识别当前运行的 Agent
默认安装到当前 Agent 的目录
安装后询问用户是否扩展到其它 Agent
避免使用 --all（会创建 40+ 个目录）

单一真相源原则：

Skills.sh 安装以 ~/.agents/skills/ 为主目录
Hermes 通过 skills.external_dirs 配置扫描 ~/.agents/skills/，无需软链接或副本
SkillHub 安装以 ~/.hermes/skills/ 为主目录

4.5 安装后验证

检查安装路径：确认 skill 文件存在于目标 Agent 的技能目录中
读取已安装 SKILL.md：确认内容与预期一致
确认安全审计结果与评估时一致
提醒用户审查 SKILL.md 内容后再使用

输出格式

评估完成后，按以下结构输出：

搜索摘要：找到 N 个候选 skills
综合对比表：合并所有关键指标
安全评估详情：每个 skill 的风险点和加分项
分级推荐：按安全/功能/组合三个维度
安装命令：用户可直接复制执行的命令
安装后验证结果：确认安装成功且内容一致

Related skills

More from cnife/skills

Installs

Repository

cnife/skills

First Seen

Apr 13, 2026

Security Audits

Gen Agent Trust HubPass

SocketWarn

SnykWarn