text-splitter
SKILL.md
文本分割工具
功能
将文本分割成指定大小的块,保持语义完整性,便于后续的批处理和分析。
使用场景
- 处理超长文本,将其拆分为智能体可处理的片段。
- 进行文本预处理,为后续的内容分析、摘要或评估任务提供标准化输入。
- 优化文本处理流程,确保每个处理单元的大小可控且语义完整。
核心能力
- 语义完整性优先: 在分割时尽量避免截断句子或段落,优先在自然边界处(如句号、换行符)分割,确保每个块的语义完整性。
- 保持原始格式: 在分割过程中,努力保留文本的原始格式和结构,例如Markdown、HTML标签等。
- 精确控制块大小: 严格按照指定的大小限制进行分割,确保每个文本块不超过预设的最大长度。
- 多种分割策略: 支持基于字符数、token数、段落数或特定分隔符等多种分割策略。
输入要求
- 文本内容: 待分割的原始文本。
- 块大小限制: 每个文本块的最大长度(建议提供字符数或 token 数)。
- 分割策略(可选): 指定分割时优先考虑的策略,如按句分割、按段落分割、按特定分隔符分割等。
输出格式
【文本分割报告】
- 原始文本长度: [整数] 字/Token
- 目标块大小: [整数] 字/Token
- 实际分割块数: [整数] 块
### 分割结果
- 块1 (长度: [整数] 字/Token): "[内容预览...]"
- 块2 (长度: [整数] 字/Token): "[内容预览...]"
- 块3 (长度: [整数] 字/Token): "[内容预览...]"
...
约束条件
- 分割结果必须严格符合指定的块大小限制。
- 确保在分割时最大限度地保持文本的语义完整性。
- 输出格式必须结构化,清晰展示每个文本块的内容和长度。
- 避免在输出中引入任何额外信息或解释,只提供分割结果。
示例
参见 {baseDir}/references/examples.md 目录获取更多详细示例:
examples.md- 包含不同长度、不同分割策略和复杂文本结构的分割示例。
详细文档
参见 {baseDir}/references/examples.md 获取关于文本分割工具的详细指导与案例。
版本历史
| 版本 | 日期 | 变更 |
|---|---|---|
| 2.1.0 | 2026-01-11 | 优化 description 字段,使其更精简并符合命令式语言规范;模型更改为 opus;优化功能、核心能力、输入要求、输出格式的描述,使其更符合命令式语言规范;添加使用场景、约束条件、示例和详细文档部分。 |
| 2.0.0 | 2026-01-11 | 按官方规范重构 |
| 1.0.0 | 2026-01-10 | 初始版本 |
Weekly Installs
18
Repository
vangongwanxiaow…e-skillsGitHub Stars
58
First Seen
Jan 22, 2026
Security Audits
Installed on
opencode15
gemini-cli14
cursor13
codex13
cline11
github-copilot11