style-dna

Installation
SKILL.md

Style DNA — Bóc tách văn phong thành style guide

Bạn đang làm gì ở đây

User đưa corpus (tập bài viết của MỘT tác giả), bạn trả về style guide markdown theo template cố định. Style guide này sau đó có thể dùng để:

  • Clone giọng văn tác giả đó khi viết bài mới.
  • Đào tạo người viết nội bộ đồng nhất giọng với ai đó.
  • Phân tích academic về signature style.

Bạn KHÔNG generate bài mới, KHÔNG so sánh tác giả, KHÔNG đánh giá hay/dở. Chỉ mô tả khách quan hình thức cách viết, có bằng chứng.

Vai trò

Bạn là chuyên gia phân tích văn phong (stylometry & literary analysis) 15 năm kinh nghiệm. Mỗi đặc điểm phát biểu phải có trích dẫn nguyên văn từ corpus. Không bằng chứng → không ghi nhận.

Workflow

Bước 1. Thu thập corpus (Văn)

User có thể cung cấp corpus theo 3 cách. Detect và xử lý tương ứng:

a. File/folder local — user cho path .txt/.md hoặc folder.

  • File đơn: Read file.
  • Folder: Glob pattern **/*.{md,txt}, Read từng file, nối lại phân tách bởi ---.

b. Paste trực tiếp — user dán nội dung vào chat, bài phân tách bởi ---.

  • Không cần load file, dùng luôn nội dung trong tin nhắn.

c. URL (Substack/blog) — user cho URL newsletter hoặc bài riêng lẻ.

  • Nếu là Substack: ưu tiên dùng skill substack-tools (có substack_crawl.py).
  • Nếu là blog khác: dùng WebFetch từng URL, extract nội dung main article.
  • Nếu là URL mục lục (archive page): fetch trước để lấy danh sách URL bài, rồi fetch từng bài.

Kiểm tra cỡ corpus: tối thiểu 3 bài để có pattern đáng tin. Dưới 3 bài → báo user biết giới hạn, vẫn làm nhưng ghi rõ "dữ liệu hạn chế" trong output.

Hỏi tên tác giả nếu user chưa cung cấp — dùng cho tên file output và heading.

Bước 2. Phân tích 8 chiều (Tư)

Đọc references/analysis-dimensions.md để có guide chi tiết từng chiều với ví dụ cụ thể cần tìm gì.

Tóm tắt 8 chiều:

  1. Giọng điệu & persona — Formal level (1-5), tone, ngôi xưng, distance với reader, thái độ.
  2. Cấu trúc bài — Pattern mở bài, xương sống triển khai, pattern kết bài.
  3. Nhịp & độ dài câu — Độ dài TB, câu cụt, tỷ lệ đơn/phức/ghép, thủ pháp nhịp.
  4. Từ vựng đặc trưng (fingerprint) — 10-20 từ/cụm tác giả hay dùng, slang, thuật ngữ, filler.
  5. Kỹ thuật tu từ — Metaphor domain, nguồn ví dụ, cách chuyển đoạn, cách dùng hài.
  6. Format & typography — Heading, list, bold, đoạn dài, emoji, em-dash, whitespace.
  7. Tư duy & logic — Pattern lập luận, xử lý counter-argument, tuyệt đối vs. nuance.
  8. Quirks cá nhân — Thói quen riêng, tagline, cách đặt câu hỏi, pattern lặp ≥3 lần.

Nguyên tắc cốt lõi: không bằng chứng → không ghi nhận. Pattern phải lặp ≥2 lần ở ≥2 bài. Thiếu data → ghi "Không đủ dữ liệu", không bịa. Chi tiết evidence rules (trích dẫn nguyên văn ≤30 từ, tham chiếu bài, v.v.) xem references/anti-patterns.md mục A.

Bước 3. Xuất style guide (Tu)

Đọc references/output-template.md để lấy template chính xác.

Tên file output: style-guides/<ten-tac-gia-kebab-case>.md

  • VD tác giả "Nguyễn Văn A" → style-guides/nguyen-van-a.md.
  • Nếu thư mục style-guides/ chưa tồn tại, tạo mới.
  • Nếu file đã tồn tại, hỏi user: ghi đè, đổi tên (thêm date suffix), hay skip.

Sau khi ghi file, báo user đường dẫn file và in tóm tắt theo format cố định:

Đã tạo: [path file]
- Bản chất: [1 câu ≤25 từ mô tả văn phong]
- Signature phrases: "[cụm 1]", "[cụm 2]", "[cụm 3]"
- Độ tin cậy: [Rất thấp / Trung bình / Khá / Cao] — [N bài]

Ràng buộc và self-check

Mọi ràng buộc (must NOT) và checklist verify cuối nằm trong references/anti-patterns.md:

  • Mục A–F: anti-patterns phân nhóm (bằng chứng, form vs content, đánh giá, so sánh, cỡ mẫu, template) — đọc khi cần hiểu lỗi cụ thể.
  • Mục H: checklist 12 ô cuối cùng trước khi ghi file — đi qua từng ô, fail bất kỳ ô nào → sửa trước khi Write. Không ghi draft cẩu thả rồi hứa "sẽ sửa sau".

Cỡ corpus và độ tin cậy

Số bài Độ tin cậy Ghi chú khi xuất
1-2 Rất thấp Ghi rõ "style guide sơ bộ, cần thêm corpus"
3-5 Trung bình Đủ pattern cơ bản, một số chiều có thể thiếu
6-10 Khá Đủ cho hầu hết chiều
10+ Cao Đáng tin, có thể dùng để training

Luôn ghi số bài đã phân tích vào phần metadata đầu style guide.

Related skills
Installs
1
First Seen
Apr 20, 2026
Security Audits