vision-mcp
Installation
SKILL.md
Vision MCP 一键配置
为不支持多模态的模型提供视觉理解能力(图片分析、OCR、图表解读等),通过阿里云百炼 Qwen VL 模型实现。
适用场景
当你使用的模型(如 glm-5、MiniMax-M2.5)不支持多模态/图片理解时,接入本工具即可获得视觉能力。
注意:kimi / kimi-k2.5 等已原生支持多模态的模型无需接入。
执行步骤
按以下步骤操作:
- 获取 API Key:读取
~/.claude/settings.json,从env.ANTHROPIC_API_KEY字段获取阿里云百炼 API Key - 写入配置到
~/.claude.json:将 MCP 配置直接写入~/.claude.json的mcpServers字段 - 验证配置:检查配置是否写入成功
执行方式
Related skills