VLM_Expert

SKILL.md

VLM (Vision Chat) 技能

使 AI 能够理解并响应结合了图像和文本提示的内容。

核心功能

  • 图像分析: 识别图片中的物体和场景。
  • 多图对比: 同时分析多张图片。

CLI 示例

z-ai vision --prompt "图中有什么?" --image "./photo.jpg"
Weekly Installs
3
GitHub Stars
1
First Seen
Feb 8, 2026
Installed on
openclaw2
gemini-cli2
replit2
mcpjam1
openhands1
zencoder1