skills/yangliu2060/smith--skills/ai-readability-audit

ai-readability-audit

SKILL.md

AI 网站可读性审计

模拟 AI 爬虫的视角审计你的网站,检查结构化数据、Meta 信息是否对大模型友好。

为什么需要 AI 可读性审计?

传统的 SEO 审计关注 Googlebot,但 AI 搜索时代,你的网站还需要对 LLM 友好:

  • ChatGPT 通过 Bing 抓取网页
  • Perplexity 直接抓取和引用网站
  • Claude 通过搜索增强回答问题

如果你的网站对 AI 不友好,就可能失去 AI 搜索带来的流量。

触发条件

当用户说以下内容时启动此技能:

  • "检查这个网站对AI是否友好"
  • "AI可读性审计"
  • "LLM friendliness check"
  • "网站AI优化检查"

工作流程

┌─────────────────┐    ┌─────────────────┐    ┌─────────────────┐
│  输入网站URL     │───▶│  获取HTML内容    │───▶│  提取关键特征    │
│                 │    │  (WebFetch)     │    │  Meta/Schema等  │
└─────────────────┘    └─────────────────┘    └─────────────────┘
                              ┌─────────────────────────────────────┐
                              │           AI 可读性分析              │
                              │  • 结构化数据检查                    │
                              │  • 语义标签评估                      │
                              │  • 内容清晰度评分                    │
                              │  • 生成优化建议                      │
                              └─────────────────────────────────────┘

执行步骤

步骤 1:获取网页内容

使用 WebFetch 获取目标 URL 的完整 HTML 内容。

步骤 2:提取 HTML 特征

分析以下关键元素:

Meta 信息

<title>...</title>
<meta name="description" content="...">
<meta name="keywords" content="...">
<meta property="og:title" content="...">
<meta property="og:description" content="...">

结构化数据

<script type="application/ld+json">...</script>
<!-- Schema.org 标记 -->

语义标签

<header>, <nav>, <main>, <article>, <section>, <aside>, <footer>
<h1>, <h2>, <h3>...

内容结构

  • 标题层级是否正确
  • 段落长度是否合理
  • 列表和表格使用情况
  • 链接文本是否描述性

步骤 3:AI 可读性评估

按以下维度打分(每项 0-10 分):

维度 权重 检查项
结构化数据 25% Schema.org、JSON-LD、Open Graph
语义 HTML 20% 语义标签使用、标题层级
Meta 完整性 15% title、description、keywords
内容清晰度 20% 段落结构、关键信息位置
技术可访问性 20% 无 JS 可读性、robots.txt

总分计算:加权平均,满分 100 分

步骤 4:生成审计报告

# AI 可读性审计报告

**网站**: [URL]
**审计时间**: YYYY-MM-DD HH:mm
**综合评分**: XX/100 ⭐⭐⭐☆☆

---

## 评分详情

| 维度 | 得分 | 状态 |
|------|------|------|
| 结构化数据 | X/10 | ✅/⚠️/❌ |
| 语义 HTML | X/10 | ✅/⚠️/❌ |
| Meta 完整性 | X/10 | ✅/⚠️/❌ |
| 内容清晰度 | X/10 | ✅/⚠️/❌ |
| 技术可访问性 | X/10 | ✅/⚠️/❌ |

---

## 检测结果

### ✅ 做得好的地方

1. [好的方面1]
2. [好的方面2]

### ❌ 需要改进的地方

1. **问题**: [问题描述]
   **影响**: [对AI可读性的影响]
   **建议**: [具体修复建议]

2. **问题**: [问题描述]
   **影响**: [对AI可读性的影响]
   **建议**: [具体修复建议]

---

## 详细分析

### 结构化数据

**检测到的 Schema 类型**:
- [x] Organization
- [ ] Article
- [ ] Product
- [ ] FAQ

**建议添加**:
```json
{
  "@context": "https://schema.org",
  "@type": "Article",
  "headline": "...",
  "author": {...}
}

Meta 标签

标签 当前值 建议
title [当前值] [建议值]
description [当前值] [建议值]

语义结构

标题层级:

H1: [标题] ✅
├── H2: [子标题]
│   ├── H3: [小节]
│   └── H3: [小节]
└── H2: [子标题]

问题: [如有问题]


优先修复清单

按影响程度排序:

  1. 🔴 高优先级: [问题] - 预计提升 X%
  2. 🟡 中优先级: [问题] - 预计提升 X%
  3. 🟢 低优先级: [问题] - 预计提升 X%

AI 搜索兼容性

AI 搜索引擎 兼容性 说明
ChatGPT (Bing) ⭐⭐⭐ [说明]
Perplexity ⭐⭐⭐ [说明]
Google SGE ⭐⭐ [说明]

报告由 Claude Code 自动生成


## 使用示例

### 示例 1:审计单个页面

用户: 帮我检查 https://example.com 对AI是否友好

Claude:

  1. 获取页面 HTML
  2. 提取 Meta、Schema 等信息
  3. 评估各维度得分
  4. 生成详细审计报告

### 示例 2:批量审计

用户: 检查这几个页面的AI可读性

Claude: [依次审计每个页面,生成汇总报告]


## 数据存储

审计结果默认保存到:`~/.claude/cache/ai-readability-audit/`

建议保存以下文件(便于复查、对比与回归):
- `audit-{域名}-{YYYYMMDD-HHMMSS}.md`:完整审计报告(可直接分享/粘贴)
- `audit-{域名}-{YYYYMMDD-HHMMSS}.json`:结构化结果(评分、问题清单、建议、关键证据)

可选(体积较大,按需开启):
- `html-{域名}-{YYYYMMDD-HHMMSS}.html`:抓取到的原始 HTML(用于排查“抓取内容与页面不一致”)

## AI 可读性最佳实践

### 1. 必备的结构化数据

```html
<!-- 组织信息 -->
<script type="application/ld+json">
{
  "@context": "https://schema.org",
  "@type": "Organization",
  "name": "公司名",
  "url": "https://example.com",
  "logo": "https://example.com/logo.png"
}
</script>

<!-- 文章页面 -->
<script type="application/ld+json">
{
  "@context": "https://schema.org",
  "@type": "Article",
  "headline": "文章标题",
  "author": {"@type": "Person", "name": "作者名"},
  "datePublished": "2025-01-01"
}
</script>

2. 语义 HTML 模板

<main>
  <article>
    <header>
      <h1>文章标题</h1>
      <p>文章摘要/描述</p>
    </header>

    <section>
      <h2>第一部分</h2>
      <p>内容...</p>
    </section>

    <footer>
      <p>作者信息、发布日期等</p>
    </footer>
  </article>
</main>

3. 关键信息前置

✅ 好的结构:
[核心结论/定义] - 第一段
[支持论据1]
[支持论据2]
[详细解释]

❌ 不好的结构:
[背景介绍]
[历史沿革]
[详细解释]
[最后才是结论]

依赖工具

  • WebFetch: 获取网页 HTML 内容
  • Write: 保存审计报告

限制说明

  • 只能审计可公开访问的页面
  • SPA/JavaScript 渲染的内容可能无法完整获取
  • 无法检测 robots.txt 对 AI 爬虫的限制

原始来源

改编自 n8n 模板:

Weekly Installs
4
GitHub Stars
18
First Seen
Jan 28, 2026
Installed on
opencode4
gemini-cli4
claude-code4
github-copilot3
codex3
amp3