skills/skills.volces.com/video-subtitle-skill

video-subtitle-skill

SKILL.md

视频字幕生成器 (Video Subtitle Generator)

基于 SenseAudio ASR API,为视频或音频文件自动生成字幕。

核心功能

  1. 语音识别 — 自动识别视频/音频中的语音内容,生成带时间戳的字幕
  2. 多语言支持 — 支持中文、英文、日文、韩文等 20+ 种语言
  3. 字幕翻译 — 识别后可自动翻译成目标语言
  4. 说话人分离 — 多人对话场景自动区分不同说话人
  5. 字幕烧入 — 将生成的字幕直接烧入视频输出新文件
  6. 多格式输出 — 支持 SRT / VTT / TXT / JSON 格式

使用方式

用户说出类似以下请求时触发此 Skill:

  • "帮我给这个视频加字幕"
  • "识别这个音频的内容并生成字幕"
  • "把这个英文视频翻译成中文字幕"
Installs
17
First Seen
Apr 4, 2026