pdf-to-structured

Installation
SKILL.md

PDF to Structured Data Conversion

Overview

Based on DDC methodology (Chapter 2.4), this skill transforms unstructured PDF documents into structured formats suitable for analysis and integration. Construction projects generate vast amounts of PDF documentation - specifications, BOMs, schedules, and reports - that need to be extracted and processed.

Book Reference: "Преобразование данных в структурированную форму" / "Data Transformation to Structured Form"

"Преобразование данных из неструктурированной в структурированную форму — это и искусство, и наука. Этот процесс часто занимает значительную часть работы инженера по обработке данных." — DDC Book, Chapter 2.4

ETL Process Overview

The conversion follows the ETL pattern:

  1. Extract: Load the PDF document
  2. Transform: Parse and structure the content
  3. Load: Save to CSV, Excel, or JSON

Quick Start

Related skills
Installs
33
GitHub Stars
127
First Seen
Mar 5, 2026