zhuoran-video-selfie
Installation
SKILL.md
卓然视频自拍技能 (Zhuoran Video Selfie)
基于垫图使用 WaveSpeed AI 生成"活人感"自拍视频,支持自然微动作(呼吸、眨眼等)。
When to Use
适用于以下场景:
- 需要生成卓然角色的动态自拍视频
- 为照片添加生命力和动态感
- 展示角色在场景中的自然状态
- 需要微动作增强真实感
- 用户索要视频或动态展示
Do NOT use this skill if:
- 只需要静态照片(使用 zhuoran-selfie 更高效)
- 需要大幅度动作场景(如跳舞、走路)
- 需要多人同框视频
- 需要复杂的镜头运动
- 网络条件极差(视频文件较大)
触发关键词 / Trigger Phrases:
- 卓然视频 / zhuoran video
- AI视频生成 / AI video generation
- 动态自拍 / dynamic selfie
- 活人感视频 / living video
- 视频自拍 / video selfie
- 角色视频 / character video
- 生成视频 / generate video
- 自拍视频 / selfie video
Workflow
快速开始
# 生成办公室自拍视频
openclaw skill run zhuoran-video-selfie office
# 指定场景并发送
openclaw skill run zhuoran-video-selfie cafe --target ou_xxx
# 直接调用脚本
./skills/zhuoran-video-selfie/scripts/zhuoran-video-selfie.sh westlake
命令行参数
./skills/zhuoran-video-selfie/scripts/zhuoran-video-selfie.sh <scene> \
--duration 5 \
--target <user_id> \
--caption "配文" \
--output /path/to/output.mp4
垫图配置
重要: 本 skill 需要垫图文件 assets/zhuoran_portrait_base.png。
首次使用前请复制垫图:
# 从中央 assets 目录复制
cp ~/.openclaw/workspace/assets/avatars/zhuoran_portrait_base.png \
~/.openclaw/workspace/skills/zhuoran-video-selfie/assets/
或者创建软链接:
ln -s ~/.openclaw/workspace/assets/avatars/zhuoran_portrait_base.png \
~/.openclaw/workspace/skills/zhuoran-video-selfie/assets/zhuoran_portrait_base.png
垫图要求:
- 格式: PNG
- 内容: 真人照片(非卡通形象)
- 尺寸: 建议 512x512 或更高
- 背景: 简洁,便于场景融合
API 调用流程
- 上传参考图 → WaveSpeed AI 媒体上传
- 提交视频生成任务 →
POST /api/v3/x-ai/video/generate- 模型:
bytedance/seedance-v1-pro-i2v-720p - 输入: 垫图 URL + 提示词
- 参数: duration=5, aspect_ratio="1:1"
- 模型:
- 轮询结果 →
GET /api/v3/predictions/{task_id}/result - 下载视频 → 保存到临时目录
- 飞书发送(如指定 target)→ 上传获取 file_key → 发送消息
Python API
from skills.zhuoran_video_selfie.zhuoran_video_selfie import generate_video
# 生成视频
video_path = generate_video("office", duration=5)
# 生成并发送
video_path = generate_video("cafe", duration=5, target="ou_xxx")
Available Scenes
| 场景 | 代码 | 推荐时长 | 提示词重点 |
|---|---|---|---|
| 办公室 | office |
5秒 | 自然工作姿态、微动作 |
| 咖啡厅 | cafe |
5秒 | 轻松氛围、微笑 |
| 西湖 | westlake |
5秒 | 风景互动、微风 |
| 健身房 | gym |
3秒 | 运动姿态、呼吸感 |
Guardrails
禁用场景
以下场景已被禁用(高风险):
mirror_selfie- 镜子反射,逻辑破绽明显dancing- 大幅度动作,肢体一致性难保证walking- 移动场景,背景与人物同步难group- 多人入镜,复杂度太高swimming- 水下场景,物理逻辑复杂
风险控制原则
- 时长限制: 最长5秒,避免暴露不自然动作
- 场景限制: 仅使用预定义的安全场景
- 动作限制: 微动作优先(呼吸、眨眼),避免大幅度运动
- 频率限制: 视频比照片使用频率更低
- 垫图质量: 确保垫图清晰,面部特征明确
"活人感"提示词系统
核心原则:
- 自然微动 - 呼吸、眨眼、头发飘动
- 避免完美 - 保留皮肤纹理、自然瑕疵
- 场景真实 - 自拍角度、环境互动
基础模板:
{scene_description}, subtle breathing motion and natural posture shift,
gentle hair swaying in {environment} breeze, soft smile with micro-expressions,
occasional natural blink and eye movement, {interaction},
authentic selfie perspective with slight arm visible,
natural skin texture with realistic details, 4k cinematic quality,
shallow depth of field, lifelike atmosphere
场景变体:
office:
young professional woman at modern office desk, subtle breathing motion...
working on laptop, occasional glance up from screen, natural office lighting...
cafe:
young woman at cozy cafe, subtle breathing motion...
holding coffee cup, gentle steam rising, warm ambient lighting...
备用模型方案(A/B 机制)
| 优先级 | 模型 | 端点 | 状态 | 说明 |
|---|---|---|---|---|
| A方案 | Seedance v1 pro 720p | /bytedance/seedance-v1-pro-i2v-720p |
✅ 可用 | 首选,质量好 |
| B方案 | VidU Q3 Turbo | /vidu/q3-turbo/image-to-video |
✅ 可用 | 备用,稳定 |
飞书视频发送
⚠️ 重要: 视频不能直接通过 OpenClaw message 工具的 filePath 发送,否则会显示为文件附件无法播放。
正确方式:
python3 skills/feishu-video-sender/feishu_video_sender.py \
/tmp/zhuoran_office_video.mp4 \
ou_5f3a4a920dc39a8d1835fd0085afef50
技术要点:
- 必须使用
msg_type: "media"而非"file" - 必须同时提供
file_key(视频)和image_key(封面)
Environment Requirements
WAVESPEED_KEY: WaveSpeed AI API 密钥FEISHU_APP_ID: 飞书 App ID(用于发送)FEISHU_APP_SECRET: 飞书 App Secret- Python 3.8+
- 依赖: requests
Output
- 格式: MP4 (H.264)
- 分辨率: 720p
- 比例: 1:1 (正方形,适合自拍)
- 时长: 3-5 秒
- 默认保存:
/tmp/zhuoran_{场景}_video.mp4
File Structure
skills/zhuoran-video-selfie/
├── SKILL.md # 本文档
├── zhuoran_video_selfie.py # 核心逻辑
└── scripts/
├── zhuoran-video-selfie.py # Python CLI 入口
└── zhuoran-video-selfie.sh # Bash 包装脚本(OpenClaw 入口)
Related Skills
| 技能 | 关系 | 说明 |
|---|---|---|
| zhuoran-selfie | 照片版 | 同一角色的静态照片生成 |
| clawra-video-selfie | 对应角色 | Clawra角色的视频生成 |
| video-generation | 通用视频 | 更通用的视频生成和超分功能 |
| voice-clone | 配套 | 可为视频添加克隆语音 |
About UniqueClub
Part of UniqueClub toolkit - AI-powered creative tools for dynamic video generation. Learn more: https://uniqueclub.ai
注意:本技能仅供非凡产研内部使用
Related skills
More from wulaosiji/skills
feishu-voice-sender
|
64clawra-video-selfie
|
5voice-clone
|
5wechat-article-fetcher
|
5find-skills
Helps users discover and install agent skills when they ask questions like "how do I do X", "find a skill for X", "is there a skill that can...", or express interest in extending capabilities. This skill should be used when the user is looking for functionality that might exist as an installable skill.
5video-generation
|
5