skills/amos144/zerotoken/zerotoken-openclaw

zerotoken-openclaw

SKILL.md

ZeroToken 浏览器自动化(OpenClaw)

教会 Agent 使用 ZeroToken MCP 做浏览器自动化、轨迹录制与脚本重放。旨在让 OpenClaw 执行定时/重复任务时尽量少消耗 Token

ZeroToken 项目主页:https://github.com/AMOS144/zerotoken

何时使用 / 何时不该用

  • 适合使用
    • 需要通过 OpenClaw + ZeroToken MCP 做浏览器自动化,并且未来会 重复 / 定时执行 的任务。
    • 已经有一次完整的浏览器操作轨迹,希望将其 转成低 Token 消耗的脚本 来复用。
  • 不适合使用
    • 只想临时操作一次、没有复用需求的场景(直接用 ZeroToken MCP 即可)。
    • 页面强依赖人工决策,大量步骤都需要 fuzzy_point 介入、无人值守难以兜底的任务。

前置条件

  • 当前环境中已能通过 MCP 访问名为 zerotoken 的服务器(或等价的 MCP server id)。
  • 执行浏览器操作前需先调用 browser_init;完成后可选调用 browser_close

OpenClaw 使用前准备(HTTP 模式)

当通过 OpenClaw / MCPorter 使用 ZeroToken 时,因其每次调用会新建进程,导致 browser 状态丢失。需改用 Streamable HTTP 传输模式,服务常驻:

  1. 手动启动 HTTP 服务(在后台常驻):
    • zerotoken-mcp-http,或
    • zerotoken-mcp --transport streamable-http
    • 默认端口 8000,可用 --port 或环境变量 ZEROTOKEN_HTTP_PORT 覆盖。
  2. OpenClaw 配置:在 openclaw.jsonmcpServers.zerotoken 中,使用 URL 而非 command:
    {
      "mcpServers": {
        "zerotoken": {
          "url": "http://localhost:8000/mcp"
        }
      }
    }
    
    具体字段名以 OpenClaw 文档为准(可能为 streamable-httpurl)。

MCP 未配置 / 未安装 ZeroToken 时的处理

当调用 ZeroToken 相关 MCP 工具失败,并出现类似以下症状时:

  • 找不到名为 zerotoken 的 MCP server;
  • browser_init / trajectory_start 等工具报「tool not found」「MCP server unavailable」或 import 相关错误;

Agent 应按以下顺序处理:

  1. 明确告知用户:ZeroToken MCP 尚未在当前环境安装或启用,暂时无法使用浏览器自动化脚本能力。
  2. 询问用户当前所用平台(如「Cursor / OpenClaw / 其他支持 MCP 的客户端」),并指导用户安装 ZeroToken 及浏览器依赖:
    • OpenClaw + MCPortermcporter install zerotoken --target openclaw --configure重要:OpenClaw 需用 HTTP 模式,先在后台运行 zerotoken-mcp-http,再在 openclaw.json 中将 mcpServers.zerotoken 配置为 {"url": "http://localhost:8000/mcp"}(见上文「OpenClaw 使用前准备」)。
    • 如果平台有 MCP Marketplace / 插件市场
      提示用户在市场中搜索并启用 zerotoken MCP。
    • 如果是本地 Python 环境(如命令行 / 开发机)
      提示用户依次执行:
      1. 安装包:pip install zerotoken
      2. 安装 Playwright 浏览器依赖(否则浏览器工具会报错):
        • 普通环境:playwright install chromium
        • 如使用 uv:uv run playwright install chromium --with-deps
      3. 启动 MCP Server:OpenClaw 在后台运行 zerotoken-mcp-httpCursor 等 IDE 运行 zerotoken-mcp(或由客户端自动拉起)。
      4. 在客户端中,将该 MCP server 注册为 id 为 zerotoken 的 MCP;OpenClaw 需在 openclaw.json 中配置 URL(见「OpenClaw 使用前准备」)。
  3. 在用户确认 ZeroToken 已安装并启用后,Agent 再次从 browser_init 开始执行 ZeroToken 相关步骤。

MCP 工具与流程

工具清单(与 MCP 对齐)

  • browserbrowser_init(可选 stealth: true 反爬)、browser_closebrowser_openbrowser_clickbrowser_inputbrowser_get_textbrowser_get_htmlbrowser_screenshotbrowser_wait_forbrowser_extract_data
  • trajectorytrajectory_starttrajectory_completetrajectory_gettrajectory_listtrajectory_loadtrajectory_deletetrajectory_to_script(轨迹转脚本并保存到数据库)
  • script
    • script_savescript_listscript_loadscript_delete
    • run_script:无 LLM 回放脚本执行
      • Start 模式{ "task_id": "...", "vars"?: {...} }
      • Resume 模式(高级用法){ "session_id": "...", "resolution": {...} }(由上层编排器在 DFU/模糊点暂停后恢复)
    • run_script_by_job_id:定时任务一步执行,{ "binding_key": "job_id", "vars"?: {...} },内部查绑定并执行
  • sessionsession_listsession_get(session_id):查询录制 / 回放会话明细,用于 debug、审计、定时任务复盘

脚本、轨迹与会话均由 MCP 后端存储在 SQLite 数据库 中,通过上述工具访问,不依赖本地文件路径。

可选参数:include_screenshot: false 减少响应体积;auto_save: true / adaptive: true 用于自适应元素定位。

Quick Reference

工具 / action 典型用途
browser_init 初始化浏览器会话(可选 headless/stealth)
browser_open 打开登录页或任意目标页面
browser_click 点击按钮、链接、tab 等
browser_input 在输入框内输入用户名、密码、搜索关键字等
browser_get_text/get_html 读取文本或整段 HTML,用于后续解析
browser_wait_for 等待某段文本出现/消失,避免页面还没加载完
browser_screenshot 截图留档或调试
browser_extract_data 从列表 / 表格中抽数据
trajectory_start/complete 录制一次完整的浏览器操作轨迹

典型流程

  • 录制trajectory_start(task_id, goal)browser_initbrowser_open / browser_click / browser_input 等 → trajectory_complete(export_for_ai: true)
  • 复用trajectory_list 查 task_id → trajectory_load(task_id, format) 获取轨迹
  • 管理trajectory_delete(task_id) 删除;browser 工具可传 include_screenshot: false
  • 错误:失败时返回 success: falsecoderetryable,可按 retryable 决定是否重试

何时才生成脚本

仅在以下情况根据轨迹生成可复用脚本(避免徒增 Token):

  1. 重复任务:用户明确说会多次执行(如「以后每天跑」「定时执行」「重复任务」),或 cron/上下文表明是定时/周期任务。
  2. 用户明确要求:用户说「生成可复用脚本」「保存成脚本下次用」「导出为脚本」等。

不主动生成:未提复用、未提定时/重复时,只做轨迹录制与保存。若用户后续要脚本再生成。

定时任务如何找到对应脚本(基于 job_id 绑定)

OpenClaw 以定时任务触发本 Skill 时,事件参数中会携带该任务的 job_id。ZeroToken 使用 job_id 作为绑定键(binding_key),并在 MCP 数据库的 script_bindings 表中维护「job_id ↔ 脚本」关系。

Agent 必须遵守以下约定:

  1. 优先使用 run_script_by_job_id(binding_key=job_id, vars?) 一步执行:MCP 内部查绑定、合并 default_vars、执行脚本。
  2. 若需分步控制,可调用 script_binding_get(binding_key=job_id),再 run_script(task_id, vars=merged_vars)
  3. run_script_by_job_idscript_binding_get(job_id) 返回「未找到」:
    • 提示用户「当前 job_id 尚未绑定 ZeroToken 脚本」;
    • 不要随意尝试其他脚本或自动新建脚本。
  4. 对于没有 job_id 或未标记为定时任务的场景:
    • 视为「一次性任务」,只使用 browser_* + trajectory_* 完成当前需求,不主动查找/执行脚本。

开发者应在 ZeroToken 侧或 OpenClaw 的集成层中,使用 script_binding_set(binding_key=job_id, script_task_id=..., default_vars?, description?) 预先将定时任务 job_id 与脚本 task_id 明确绑定。本 Skill 仅通过 job_id 查询绑定,不对映射关系做额外推断

配置定时任务(完整流程)

当 Agent 收到带 job_id 的定时任务配置请求(如用户说「设为每日执行」「把这个任务设为定时」),且 OpenClaw 已传入 job_id 时,必须完成以下端到端流程:

  1. 确定 task_id:用户指定、或最近录制的 trajectory 的 task_id(如 trajectory_list 取最新)。
  2. 检查轨迹trajectory_load(task_id) 检查轨迹是否存在;若无则提示用户先录制。
  3. 生成脚本script_load(task_id) 检查脚本是否存在;若无则调用 trajectory_to_script(task_id, stealth?) 根据轨迹生成并保存。
  4. 绑定script_binding_set(binding_key=job_id, script_task_id=task_id, default_vars?, description?) 将 job_id 与脚本绑定。

重要task_id 贯穿 trajectory → script → binding,三者必须一致。录制时用的 task_id 即脚本的 task_id,也是 binding 的 script_task_id

script_binding_set 返回 SCRIPT_NOT_FOUND,说明脚本不存在,应先 trajectory_to_script(task_id) 再绑定。

反爬应对(易被云盾/反爬拦截的站点)

若目标站点(如 B 站、小红书等)易被检测为自动化并拦截,需:

  1. 录制时browser_initstealth: true,降低被识别概率。
  2. 生成脚本时trajectory_to_script(task_id, stealth=true) 使生成的脚本中 browser_init 包含 stealth: true
  3. 执行时run_script 会按脚本中的 browser_init 参数执行,若脚本含 stealth: true 则自动启用反检测。

stealth 模式会启用:启动参数伪装、navigator 指纹伪装、Sec-CH-UA 头、WebGL 指纹伪装等。

定时任务执行失败时的恢复

  • SCRIPT_BINDING_NOT_FOUND:提示用户「当前 job_id 尚未绑定 ZeroToken 脚本」,需先完成配置流程。
  • SCRIPT_NOT_FOUND(binding 存在但脚本被删):若返回 hint 字段,可按提示执行 trajectory_to_script(script_task_id) 重新生成脚本(轨迹仍在时),再重试 run_script_by_job_id

脚本格式与执行方式

格式(存于 MCP 数据库)

脚本通过 script_save / script_load 读写,结构示例:

{
  "task_id": "login_daily",
  "goal": "每日登录并拉取报表",
  "steps": [
    { "action": "browser_init", "params": { "headless": true, "stealth": true } },
    { "action": "trajectory_start", "params": { "task_id": "login_daily", "goal": "每日登录并拉取报表" } },
    { "action": "browser_open", "params": { "url": "https://example.com/login" } },
    { "action": "browser_input", "params": { "selector": "#user", "text": "{{username}}" } },
    { "action": "browser_click", "params": { "selector": "#submit" },
      "fuzzy_point": { "reason": "验证码需识别", "hint": "可调 browser_extract_data 或等待人工输入" } },
    { "action": "browser_get_text", "params": { "selector": ".report" } }
  ]
}
  • steps:有序数组;每步 action 对应 MCP 工具名,params 为该工具入参。
  • 可选 fuzzy_point:记录该步「需要 AI/人介入」的语义信息(reasonhint),本身不会让 ScriptEngine 自动暂停;只有当为该步配置了匹配的 DFU / 执行点时,run_script 执行到该步才会返回 status="paused"
  • 可选参数化:params 中可用 {{varname}},执行前由 Agent 或配置替换(如环境变量、用户输入),或在 ExecutionPoint/DFU 暂停时由上层生成 resolution.vars 合并进运行时变量环境。{{varname}} 的脚本,执行前必须提供对应 varsrun_scriptvarsrun_script_by_job_idvars/binding 的 default_vars),否则占位符会保留字面量,可能导致无效输入。

执行脚本(仅在定时 / 重复任务场景)

只有在以下两种情况下,才去查找并执行脚本:

  • 上下文/cron 明确表明是「定时 / 周期性 / 重复执行」的任务(如每日评论、每小时抓取报表)。
  • 用户明确说「执行 ZeroToken 脚本 <task_id>」「跑一下 <task_id> 的脚本」等。

在这些情况下:

  1. 调用 script_load(task_id) 从 MCP 数据库读取脚本;若无则调用 trajectory_to_script(task_id) 根据轨迹生成并保存(否则不要擅自造脚本)。
  2. 调用 run_script(task_id, vars?)MCP 内的 ScriptEngine 自动按 steps 顺序执行脚本,无需 LLM,执行过程写入 session;返回形如 {"success": ..., "status": "success|paused|failed", "session_id": ...}
  3. 若返回 status="paused"(例如命中 DFU / 执行点 / 失败重试上限):
    • 上层 Agent 阅读 pause_event(包含 step_index、dfu_id、提示文案与需要生成的 vars),做一次决策或生成 vars;
    • 再调用 run_script(session_id=..., resolution={...}) 恢复执行,由 ScriptEngine 继续顺序执行后续 steps。

非定时/一次性任务:优先只用 browser_ + trajectory_ 录制与完成当前任务,不主动查找/执行脚本。**

脚本是「数据驱动的 MCP 调用序列」,存于 MCP 数据库,由 ScriptEngine 自动化回放,Token 消耗低且可通过 session 追踪每次执行。

模糊点 / DFU 执行约定

  • *有 Agent 在场(手动调用 browser_ 时)**:遇到带 fuzzy_point 的 OperationRecord / 步骤时,可把 reasonhint 视作提示,根据当前页面决定是否额外调用 browser_extract_databrowser_input 等,再继续。
  • 使用 run_script(ScriptEngine 自动回放)时:是否暂停由 DFU/执行点规则决定(dfu_* 配置 + trigger 匹配),而不是单靠 fuzzy_point。若某步既有 fuzzy_point 又命中 DFU,则 ScriptEngine 会在该步返回 status="paused" + pause_event,由上层 Agent 决定 resolution 后再恢复。
  • 无人值守:不建议依赖大量需要强人工判断的步骤;含模糊点但未配置 DFU 的脚本,在纯 run_script 模式下会直接按脚本跑完,可能需要通过 session 结果+日志事后审计。

根据轨迹生成脚本(流程)

推荐:直接调用 trajectory_to_script(task_id, script_task_id?, prepend_init?, stealth?),MCP 会从数据库加载轨迹、转换为脚本并保存,返回 task_id。若目标站点易被反爬拦截,传 stealth=true 使生成的脚本中 browser_init 包含 stealth: true

若需手动控制,可参考以下流程:

  1. 输入trajectory_load(task_id, format="json")format="ai_prompt";必要时先用 trajectory_list 选 task_id。

  2. action 映射:轨迹中的 operations[].action 为内部名,生成脚本时必须映射为 MCP 工具名;执行时按 MCP 工具名调用。

    轨迹 action 脚本/MCP action
    open browser_open
    click browser_click
    input browser_input
    get_text browser_get_text
    get_html browser_get_html
    screenshot browser_screenshot
    wait_for browser_wait_for
    extract_data browser_extract_data

    轨迹不包含 browser_inittrajectory_start;生成脚本时在 steps 开头补上这两步(若需录制回放)。

  3. 输出:调用 script_save(task_id, goal, steps) 写入 MCP 数据库;steps 中 action 用映射后的 MCP 名,params 与轨迹一致,selector_candidatesfuzzy_point 从轨迹带出。

保存位置与复用查找

  • 脚本与轨迹:均由 MCP 后端存储在数据库(SQLite)中,不依赖本地文件路径。
  • 查找:执行/复用某任务时,用 trajectory_listscript_list 得到 task_id,用 script_load(task_id) 取脚本;若无则提示「该任务尚无脚本,是否根据轨迹生成?」并直接调用 trajectory_to_script(task_id) 生成并保存。
  • 会话:每次 run_script 或录制产生 session,用 session_listsession_get(session_id) 查看。

安装

将本 Skill 放入 OpenClaw 的 skills 目录之一:

  • 工作区:./skills/zerotoken-openclaw/(仅当前项目)
  • 本地共享:~/.openclaw/skills/zerotoken-openclaw/
  • 或通过 ClawHub:clawhub install zerotoken-openclaw(若已发布)

从本仓库安装示例:克隆后复制 skills/zerotoken-openclaw/ 到上述路径之一。

常见坑

  • OpenClaw:未在后台启动 zerotoken-mcp-httpopenclaw.json 仍用 command 而非 url,导致每次调用新建进程、browser 状态丢失。
  • 忘记先调用 browser_init 就直接使用 browser_open / browser_click,导致第一次调用失败或异常。
  • 录制轨迹时未使用 export_for_ai: true,后续生成脚本时需要额外处理轨迹数据。
  • task_id 在 trajectory 与 script 中不一致,导致 script_load(task_id) 找不到对应脚本。
  • 无人值守场景仍然依赖包含大量 fuzzy_point 的脚本,容易在模糊点步骤卡住;这类任务应提前评估是否需要人工兜底。
Weekly Installs
5
GitHub Stars
186
First Seen
2 days ago
Installed on
openclaw5
opencode4
gemini-cli4
claude-code4
github-copilot4
codex4