pinchtab
PinchTab — Browser Automation for AI Agents
Control Chrome browsers via PinchTab's CLI and HTTP API. Token-efficient (~800 tokens/page), fast startup, stable element references, built-in stealth.
Prerequisites
# Install (pick one)
curl -fsSL https://pinchtab.com/install.sh | bash
brew install pinchtab/tap/pinchtab
npm install -g pinchtab
# Start server (skip if already running)
pinchtab server &
curl -s http://localhost:9867/health
Core Concepts
Server → Profile (prof_XXX) → Instance (inst_XXX) → Tab (tab_XXX) → Element Refs (e0, e1, e5)
- Profile — Persistent browser data (cookies, storage). Reuse profiles to keep login sessions alive.
- Instance — Running Chrome process (max 1 per profile).
- Element Ref — Stable IDs from snapshots for clicking/filling. Re-snapshot after page changes because refs become stale.
Choosing the Right Approach
| Situation | Approach | Why |
|---|---|---|
| Hầu hết tasks | CLI | Đơn giản, không cần parse JSON, 1 lệnh = 1 hành động |
| Cần batch actions hoặc tích hợp script | HTTP API | Batch/macro endpoint giảm request overhead |
| Chỉ cần đọc nội dung trang | pinchtab text |
Token-efficient nhất (~800 tokens) |
| Cần tương tác (click, fill) | pinchtab snap -ic → action |
Compact interactive snapshot cho refs, rồi act |
| Sau khi thực hiện action | pinchtab snap -d |
Diff snapshot — chỉ lấy thay đổi, tiết kiệm token |
| Cần debug visual | pinchtab screenshot |
Token cost cao — chỉ dùng khi text/snap không đủ |
| Site có bot detection | Bật stealth trước | pinchtab config set chrome.stealth light |
CLI Workflow (Default)
# 1. Navigate
pinchtab nav https://example.com
# 2. Read content (chọn 1)
pinchtab text # plain text — most efficient
pinchtab snap -ic # interactive elements only — for interaction
pinchtab quick <url> # navigate + snapshot in one command
# 3. Interact
pinchtab fill e3 "value" # fill field (clears first)
pinchtab click e5 # click element
pinchtab press Enter # keyboard key
# 4. Verify result
sleep 1 # wait for page update
pinchtab snap -d # diff snapshot — only changes
Multi-Tab
pinchtab tab new https://source.com # open new tab
pinchtab tab # list tabs with IDs
pinchtab tab tab_XXX # switch to tab
pinchtab tab close tab_XXX # close tab
Error Recovery
Lỗi phổ biến nhất: stale element refs (action fail vì trang đã thay đổi).
Action fail → re-snapshot (pinchtab snap -ic) → retry với ref mới
| Lỗi | Xử lý |
|---|---|
| Element ref not found | Re-snapshot, dùng ref mới |
| Server not running | pinchtab server & |
| Instance won't start | Kiểm tra pinchtab instances, stop instance cũ nếu cần |
| Bot detection | pinchtab config set chrome.stealth light + --humanize flag |
Environment Variables
| Variable | Purpose | Default |
|---|---|---|
PINCHTAB_PORT |
Server port | 9867 |
PINCHTAB_TOKEN |
API auth token (thêm -H "Authorization: Bearer $TOKEN" nếu set) |
(none) |
PINCHTAB_HEADLESS |
Headless mode | true |
Reference
Chi tiết tra cứu khi cần:
- HTTP API — Endpoints, payloads, response formats, error codes. Đọc khi cần gọi HTTP API trực tiếp.
- CLI commands — Tất cả CLI commands + flags. Đọc khi cần tìm lệnh cụ thể hoặc flags nâng cao.
- Workflow patterns — 12 patterns phổ biến (scraping, login, pagination, stealth, multi-tab...). Đọc khi gặp scenario phức tạp cần tham khảo.
More from hoangvantuan/claude-plugin
creative-thought-partner
Interactive creative thought partner — discovers hidden brilliance through pattern spotting, paradox hunting, and naming unnamed concepts.
58writer-agent
Viết bài từ tài liệu - chuyển PDF, DOCX, EPUB, URL, YouTube, hoặc text thành series bài viết tiếng Việt theo style tùy chọn (7 presets hoặc custom 5 dimensions). Hỗ trợ tài liệu từ vài trang đến 100K+ words với tier-based processing. Output tại CWD/writer-agent/.
54prompt-generator
Meta-prompting skill — creates well-structured, verifiable, low-hallucination prompts for any use case.
41deep-learner
Dẫn dắt từng bước hiểu sâu bản chất nội dung (bài viết, sách, video) — từ bề mặt đến nguyên lý gốc, kết nối liên lĩnh vực, và áp dụng vào đời sống.
38wisdom-mentor
Đối thoại với 28 người thầy tri thức — mang phong cách tư duy và triết lý của các bậc thầy tư tưởng.
37content-planner
Plan and write full content from any input. Blog-first workflow — writes blog articles first, then derives social posts (1:1 mapping). Advanced writing style with auto web research.
34