word-reader
SKILL.md
Word 文档读取器
使用 Python 解析 Word 文档,提取文本内容和结构化信息。
支持的功能
- 文档文本提取 - 提取段落、标题、页眉页脚内容
- 表格解析 - 读取表格数据并转换为结构化格式
- 图片处理 - 提取文档中的图片信息
- 元数据获取 - 读取文档属性(作者、标题、创建时间等)
- 批量处理 - 支持处理多个文档
用法
基本文本提取
python3 {baseDir}/scripts/read_word.py <文件路径>
使用 Python 解析 Word 文档,提取文本内容和结构化信息。
python3 {baseDir}/scripts/read_word.py <文件路径>