text-splitter

SKILL.md

文本分割工具

功能

将文本分割成指定大小的块,保持语义完整性,便于后续的批处理和分析。

使用场景

  • 处理超长文本,将其拆分为智能体可处理的片段。
  • 进行文本预处理,为后续的内容分析、摘要或评估任务提供标准化输入。
  • 优化文本处理流程,确保每个处理单元的大小可控且语义完整。

核心能力

  • 语义完整性优先: 在分割时尽量避免截断句子或段落,优先在自然边界处(如句号、换行符)分割,确保每个块的语义完整性。
  • 保持原始格式: 在分割过程中,努力保留文本的原始格式和结构,例如Markdown、HTML标签等。
  • 精确控制块大小: 严格按照指定的大小限制进行分割,确保每个文本块不超过预设的最大长度。
  • 多种分割策略: 支持基于字符数、token数、段落数或特定分隔符等多种分割策略。

输入要求

  • 文本内容: 待分割的原始文本。
  • 块大小限制: 每个文本块的最大长度(建议提供字符数或 token 数)。
  • 分割策略(可选): 指定分割时优先考虑的策略,如按句分割、按段落分割、按特定分隔符分割等。

输出格式

【文本分割报告】

- 原始文本长度: [整数] 字/Token
- 目标块大小: [整数] 字/Token
- 实际分割块数: [整数] 块

### 分割结果
- 块1 (长度: [整数] 字/Token): "[内容预览...]"
- 块2 (长度: [整数] 字/Token): "[内容预览...]"
- 块3 (长度: [整数] 字/Token): "[内容预览...]"
...

约束条件

  • 分割结果必须严格符合指定的块大小限制。
  • 确保在分割时最大限度地保持文本的语义完整性。
  • 输出格式必须结构化,清晰展示每个文本块的内容和长度。
  • 避免在输出中引入任何额外信息或解释,只提供分割结果。

示例

参见 {baseDir}/references/examples.md 目录获取更多详细示例:

  • examples.md - 包含不同长度、不同分割策略和复杂文本结构的分割示例。

详细文档

参见 {baseDir}/references/examples.md 获取关于文本分割工具的详细指导与案例。


版本历史

版本 日期 变更
2.1.0 2026-01-11 优化 description 字段,使其更精简并符合命令式语言规范;模型更改为 opus;优化功能、核心能力、输入要求、输出格式的描述,使其更符合命令式语言规范;添加使用场景、约束条件、示例和详细文档部分。
2.0.0 2026-01-11 按官方规范重构
1.0.0 2026-01-10 初始版本
Weekly Installs
8
GitHub Stars
58
First Seen
Jan 26, 2026
Installed on
github-copilot7
opencode7
codex6
amp6
gemini-cli6
cursor6