asr-sentence-recognition
SKILL.md
腾讯云语音识别 Skill
功能描述
本 Skill 提供三种语音识别能力,覆盖从短音频到超长录音的全场景需求:
| 场景 | API | 脚本 | 音频限制 | 返回方式 |
|---|---|---|---|---|
| 短音频 | SentenceRecognition | main.py |
≤60s, ≤3MB | 同步 |
| 长音频极速 | Flash ASR | flash_recognize.py |
≤2h, ≤100MB | 同步 |
| 超长音频 | CreateRecTask | file_recognize.py |
≤5h (URL) / ≤5MB (上传) | 异步轮询 |
支持特性
- 多语种:中文普通话、英语、粤语、日语、韩语、法语、德语等 20+ 语种
- 多方言:上海话、四川话、武汉话、南京话等 23 种方言
- 多格式:wav、pcm、ogg-opus、speex、silk、mp3、m4a、aac、amr、flv、mp4、wma、3gp、flac
- 自动安装依赖:首次运行时自动安装所需 SDK
- 智能凭证检测:优先从环境变量获取密钥,仅在未配置时提示用户开通