tutor
SKILL.md
Tutor - 一对一辅导老师
核心工作流
WORKFLOW = [
# 步骤1: 数学建模
{
"step": 1,
"name": "analyze_problem",
"input": "题目图片/文本",
"output": "math_analysis.md",
"tasks": ["推导数学事实", "建立几何模型", "确定图形构建方法"]
},
# 步骤2: HTML可视化
{
"step": 2,
"name": "html_visualization",
"input": "math_analysis.md",
"output": "数学_{日期}_{题目}.html",
"tasks": ["SVG画图形", "展示画图过程", "标注关键要素"]
},
# 步骤3: 分镜脚本
{
"step": 3,
"name": "storyboard",
"input": "HTML内容",
"output": "{日期}_{题目}_分镜.md",
"tasks": ["定义幕结构(不限制幕数)", "设计画面/字幕/读白", "音频清单(时长留空)"]
},
# 步骤4: TTS生成
{
"step": 4,
"name": "generate_tts",
"input": "分镜脚本",
"output": "audio/audio_{三位幕号}_{幕名}.wav + audio_info.json",
"command": "python scripts/generate_tts.py audio_list.csv ./audio --voice xiaoxiao"
},
# 步骤5: 验证更新
{
"step": 5,
"name": "validate_audio",
"input": "分镜.md + audio/",
"output": "更新后的分镜.md(填充时长) + audio_info.json",
"command": "python scripts/validate_audio.py 分镜.md ./audio",
"check": ["音频存在性", "时长>0", "数量匹配"]
},
# 步骤6: 脚手架
{
"step": 6,
"name": "scaffold",
"input": "分镜.md + audio_info.json",
"output": "script.py (伪代码框架)",
"template": "templates/script_scaffold.py",
"must_include": [
"calculate_geometry() - 几何建模",
"assert_geometry() - 几何验证(题目条件+精度) + 画布范围检查(边界+中心)",
"COLORS - 颜色定义",
"SCENES[] - 幕信息数组(从audio_info.json加载时长)",
]
},
# 步骤7: 生成代码
{
"step": 7,
"name": "implement",
"input": "script.py脚手架 + 分镜.md + audio_info.json",
"output": "完整的script.py",
"rules": [
"根据分镜实现每幕动画",
"读白提到什么就高亮什么",
"画面时长 >= 音频时长",
"calculate_geometry()必须完整实现"
]
},
# 步骤8: 检查与渲染
{
"step": 8,
"name": "check_and_render",
"input": "script.py",
"output": "视频文件 + 关键帧截图",
"command": "python scripts/render.py",
"check": ["代码结构检查(check.py)", "几何正确性", "高亮同步", "字幕清晰", "动画流畅"],
"on_fail": "回到步骤7修改代码"
}
]
# 工作流状态转换
# step1 → step2 → step3 → step4 → step5 → step6 → step7 → step8
# ↑____________↓ (失败时循环)
步骤1:分析题目,推导数学事实
目标:建立正确的数学计算方法和流程,形成画出符合数学的图形的方法。
输出格式
## 数学事实分析
### 已知条件
- 条件1:...
- 条件2:...
### 推导的事实
1. **事实名称**: 描述
- 计算过程: ...
- 数学表达: ...
### 图形构建方法
- 点的坐标: ...
- 边的关系: ...
- 圆/弧的定义: ...
### 需要证明的结论
- 结论1: ...
注意:所有证明题需要证明的结论,在分镜中都可以作为已确立的事实来使用。
步骤2:HTML + SVG 可视化
目标:用 HTML + SVG 画出图形,展示画图过程和解答流程,为分镜做规划。 补充:如果用户已经提供了准确的HTML文件,描述了画图过程,可以按文件名要求复制一份,跳过生成文件。
输出要求
- 文件命名:
数学_{日期}_{题目简述}.html - 包含:题目陈述、SVG 图形、分步解答、关键要素标注
- SVG 需要展示画图过程(如:先画三角形 → 再画圆 → 标注点)
步骤3:生成分镜脚本
目标:定义视频结构,不限制幕数,结尾预留音频文件名(时长为空)。
文件命名
{日期}_{题目}_分镜.md
分镜脚本结构
# 分镜脚本 - {题目名称}
## 分镜设计
### 第1幕:{幕名}
**画面**: ...
**字幕**: ...(简洁,≤20字)
**读白**: ...(详细,口语化)
**动画**: ...
**目的**: ...
---
## 音频生成清单(步骤4填写)
| 幕号 | 文件名 | 读白文本 | 时长 | 说话人 | 情感 |
|------|--------|----------|------|--------|------|
| 1 | audio_001_{幕名}.wav | "读白文本" | | xiaoxiao | 热情 |
| 2 | audio_002_{幕名}.wav | "读白文本" | | xiaoxiao | 平和 |
关键规范
- 幕号从1开始连续编号
- 文件名格式:
audio_{三位幕号}_{幕名}.wav - 时长列为空,由步骤5填充
- 不限制幕数,根据内容需要决定
字幕退场约定(重要)
为了避免动画中文字忘记退场,在分镜的动画部分使用以下约定指定退场时机:
**动画**:
- 0.0s: 字幕"勾股定理"淡入
- 2.0s: → 字幕退场(或:字幕淡出)
- 3.0s: 图形高亮
退场标记方式(三选一):
→箭头符号表示退场(推荐,最简洁)退场:或淡出:显式标记持续X秒指定显示时长
示例:
**动画**:
- 字幕"正方形性质"淡入,持续3秒 → 自动退场
- 0.0s: 标题淡入 | 3.0s: →
- 公式分步显示,第5秒全部退场
参考示例
见 references/storyboard_sample.md - 第九十九题:证明四点共圆
步骤4:TTS 生成语音文件
使用脚本:scripts/generate_tts.py(Edge TTS 推荐)
执行命令
python scripts/generate_tts.py 分镜.md ./audio --voice xiaoxiao
输出文件
audio/
├── audio_001_开场.wav
├── audio_002_展示图形.wav
├── audio_003_定理证明.wav
├── ...
└── audio_info.json
audio_info.json 格式
{
"files": [
{"scene": 1, "file": "audio_001_开场.wav", "duration": 8.5},
{"scene": 2, "file": "audio_002_展示图形.wav", "duration": 15.2}
]
}
步骤5:验证并更新分镜时长
使用脚本:scripts/validate_audio.py
功能
- 读取
audio/audio_info.json获取音频时长 - 验证所有音频文件存在且时长正常(>0秒)
- 更新分镜脚本的"音频生成清单"中的时长列
- 如果缺少音频或时长异常,报错提醒
执行命令
python scripts/validate_audio.py 分镜.md ./audio
验证失败情况
- 缺少音频文件 → 报错:"缺少第X幕音频文件"
- 时长为0或异常 → 报错:"第X幕音频时长异常,请检查格式"
- 分镜与音频数量不匹配 → 报错:"分镜X幕,音频Y个,数量不匹配"
步骤6:生成 script.py 脚手架
使用模板:templates/script_scaffold.py
输出:script.py(肯定 build 不过的伪代码框架)
脚手架必须包含的部分
from manim import *
import json
import os
class MathScene(Scene):
"""
数学教学视频场景 - 脚手架
根据分镜脚本和音频信息生成完整动画
"""
# ========== 1. 颜色定义 ==========
COLORS = {
'background': '#1a1a2e', # 深蓝背景
'primary': '#4ecca3', # 主色(青色)
'secondary': '#e94560', # 辅助色(红色)
'highlight': '#ffc107', # 高亮色(黄色)
'text': '#ffffff', # 文字白色
'grid': '#2a2a4e', # 网格线
}
# ========== 2. 幕信息数组(供AI参考) ==========
# 格式: (幕号, 幕名, 音频文件名, 时长秒数)
# 注意:时长从 audio_info.json 读取,确保画面等待音频原则
SCENES = [
(1, "开场", "audio_001_开场.wav", None),
(2, "展示图形", "audio_002_展示图形.wav", None),
# ... 根据分镜动态生成
]
def __init__(self, **kwargs):
super().__init__(**kwargs)
# 加载音频时长信息
self.audio_timings = self._load_audio_timings()
def _load_audio_timings(self):
"""从 audio_info.json 加载音频时长"""
# TODO: AI实现 - 读取JSON并填充 SCENES 的时长
pass
# ========== 3. 几何计算函数 ==========
def calculate_geometry(self):
"""
计算所有几何元素的位置和属性
从步骤2的HTML画图中提取信息,建立数学模型:
- 所有点的坐标 (x, y) - ⚠️ 始终使用2D,z坐标始终为0
- 边的长度和方程
- 圆/弧的圆心和半径
- 交点计算
- 切线、法线等辅助线
返回: dict 包含所有几何对象的数据
"""
# TODO: AI根据题目几何关系实现
geometry = {
'points': {}, # {'A': (x, y), 'B': (x, y), ...}
'lines': {}, # {'AB': {'start': A, 'end': B, 'length': L}, ...}
'circles': {}, # {'circle1': {'center': O, 'radius': r}, ...}
'arcs': {}, # 圆弧定义
}
return geometry
# ========== 4. 几何验证函数 ==========
def assert_geometry(self, geometry):
"""
验证几何计算的正确性(最小验证原则)
验证内容:
1. 题目给定的事实(如:两条边相等,谁是谁的一半)
2. 精度问题:使用相对误差比较,而非绝对相等
3. 画布范围检查:确保图形在可视区域内
4. 错误提示:所有assert必须用中文描述问题,包含具体数值和修复建议
=== 几何条件验证 ===
基于题目给定的条件,编写最小但关键的验证:
- 如果题目说 AB = BC,验证 |AB - BC| < epsilon
- 如果题目说 E 是中点,验证 AE = EB(考虑浮点误差)
- 如果题目说某角是直角,验证向量点积接近0
- 如果题目给具体数值(如边长为5),验证计算结果匹配
精度建议:
- 相对误差:1e-6 或绝对误差 1e-4
- 示例:assert abs(len_AB - len_BC) < 1e-4, "中文错误提示:AB长度不等于BC长度"
=== 画布范围验证算法 ===
目标:确保整个图形在画布内,且位于视觉中心区域
算法步骤(AI需要根据几何数据实现):
1. 计算所有几何元素的外接矩形 bounding_box
- 遍历所有点、线、圆的边界点
- 取最小x, 最大x, 最小y, 最大y
2. 验证矩形在画布范围内(考虑边距)
- 画布默认范围:FRAME_WIDTH=14.2, FRAME_HEIGHT=8
- 建议边距:四周各留 0.5-1.0 单位
- 验证:min_x > -7+margin 且 max_x < 7-margin
min_y > -4+margin 且 max_y < 4-margin
3. 验证矩形中心在视觉中心区域
- 画布中心:(0, 0)
- 视觉中心区域:中心 ±20%(即 x∈[-1.4, 1.4], y∈[-0.8, 0.8])
- 计算矩形中心:(center_x, center_y) = ((min_x+max_x)/2, (min_y+max_y)/2)
- 验证:center_x ∈ [-1.4, 1.4] 且 center_y ∈ [-0.8, 0.8]
4. 如果图形超出范围,AI需要调整几何计算的缩放或平移
"""
# === TODO: AI实现 - 基于题目条件的验证(失败时用中文报错)===
# 示例代码(根据实际题目修改):
# epsilon = 1e-4
# len_ab = geometry['lines']['AB']['length']
# len_bc = geometry['lines']['BC']['length']
# assert abs(len_ab - len_bc) < epsilon, f"几何验证失败:AB长度({len_ab:.4f})不等于BC长度({len_bc:.4f}),题目要求两边相等"
#
# len_ae = geometry['lines']['AE']['length']
# len_ab = geometry['lines']['AB']['length']
# assert abs(len_ae * 2 - len_ab) < epsilon, f"几何验证失败:E不是AB中点,AE({len_ae:.4f})*2={len_ae*2:.4f} != AB({len_ab:.4f})"
# === TODO: AI实现 - 画布范围检查(失败时用中文报错)===
# 1. 计算bounding_box
# all_points = list(geometry['points'].values())
# min_x = min(p[0] for p in all_points)
# max_x = max(p[0] for p in all_points)
# min_y = min(p[1] for p in all_points)
# max_y = max(p[1] for p in all_points)
#
# 2. 验证画布边界(失败时报具体数值)
# margin = 0.5
# assert min_x > -7 + margin, f"画布验证失败:图形左边界(min_x={min_x:.2f})超出安全区域(>{-7+margin}),需要向右平移或缩小"
# assert max_x < 7 - margin, f"画布验证失败:图形右边界(max_x={max_x:.2f})超出安全区域(<{7-margin}),需要向左平移或缩小"
# assert min_y > -4 + margin, f"画布验证失败:图形下边界(min_y={min_y:.2f})超出安全区域(>{-4+margin}),需要向上平移或缩小"
# assert max_y < 4 - margin, f"画布验证失败:图形上边界(max_y={max_y:.2f})超出安全区域(<{4-margin}),需要向下平移或缩小"
#
# 3. 验证视觉中心(失败时报具体偏移)
# center_x = (min_x + max_x) / 2
# center_y = (min_y + max_y) / 2
# assert -1.4 <= center_x <= 1.4, f"视觉中心验证失败:图形中心X={center_x:.2f}超出视觉中心区域[-1.4, 1.4],建议调整几何计算使图形居中"
# assert -0.8 <= center_y <= 0.8, f"视觉中心验证失败:图形中心Y={center_y:.2f}超出视觉中心区域[-0.8, 0.8],建议调整几何计算使图形居中"
pass
# ========== 5. 图形元素定义 ==========
def define_elements(self, geometry):
"""
定义 Manim 图形对象(但不创建动画)
为每一幕需要的图形元素预先定义,便于结构化调用:
- 点、线、圆的基础对象
- 高亮效果对象
- 标注文字对象
"""
# TODO: AI根据分镜需求定义
elements = {
'points': {}, # Mobject 点对象
'lines': {}, # Mobject 线对象
'circles': {}, # Mobject 圆对象
'labels': {}, # 标签文字
}
return elements
# ========== 6. 构造主流程 ==========
def construct(self):
"""主构造流程"""
# 计算几何
geometry = self.calculate_geometry()
self.assert_geometry(geometry)
elements = self.define_elements(geometry)
# 设置背景
self.camera.background_color = self.COLORS['background']
# 按幕执行
for scene_num, scene_name, audio_file, duration in self.SCENES:
self.play_scene(scene_num, scene_name, audio_file, duration, elements, geometry)
def play_scene(self, scene_num, scene_name, audio_file, duration, elements, geometry):
"""
播放单幕动画 - 必须添加音频
========== 音频集成(强制要求) ==========
每幕必须添加对应的音频文件,否则视频将没有声音!
方式:在方法第一行就添加音频
self.add_sound(f"audio/{audio_file}")
注意:
- audio_file 参数已经包含文件名(如 "audio_001_开场.wav")
- 音频文件位于 audio/ 目录下
- 添加音频后,后续动画时长应 >= duration(音频时长)
========== 画面等待音频原则 ==========
- 动画总时长 >= 音频时长(duration 参数)
- 可以画面多等待(多出静音部分,后期可剪辑)
- 不能画面比音频短(会导致音频被截断)
========== 高亮规范(必须在读白提到时同步) ==========
- 提到某个边等于某个边 → 用动画高亮两条边
- 提到某个点/圆 → 闪烁或放大高亮
- 提到证明结论 → 用框或颜色强调
========== 绘制策略 ==========
- 简单图形:直接显示,然后高亮关键部分
- 复杂图形:逐步绘制,边画边讲解
"""
# TODO: AI实现 - 第一行必须添加音频!
# self.add_sound(f"audio/{audio_file}")
pass
# ========== 7. 音频集成 ==========
def add_audio_to_scene(self, audio_file, animation_duration):
"""
添加音频到场景
方式1(推荐):在script.py中直接添加音频文件
self.add_sound(audio_file)
方式2:如果需要在特定时间点触发,使用延时
确保:animation_duration >= 音频实际时长
"""
# TODO: AI实现音频集成
pass
步骤7:AI 生成最终代码
输入:
- 分镜脚本(已更新时长)
audio/audio_info.jsonscript.py脚手架
输出:完整的 script.py
AI 生成指导:
- 根据分镜的"动画"描述实现具体动画代码
- 根据"读白"内容确定高亮时机
- 实现
calculate_geometry()的具体计算 - 实现
assert_geometry()的验证逻辑 - 为每幕实现
play_scene_X()方法 - 音频集成(必须):
- 每幕的第一行必须是
self.add_sound(f"audio/{audio_file}") - 确保动画总时长 >= 音频时长(使用
duration参数) - 如果动画太短,添加
self.wait()来延长
- 每幕的第一行必须是
- 验证音频文件路径正确:
audio/audio_001_XXX.wav - 字幕显示与退场(关键):
- 使用脚手架提供的
show_subtitle_timed(text, duration)方法显示定时字幕 - 或使用
show_subtitle_with_audio(text, audio_duration)让字幕持续到音频结束 - 分镜中的
→或退场:标记表示文字需要在该时间点淡出 - 必须确保所有文字元素都有退场动画,避免残留到下一幕
- 使用脚手架提供的
步骤8:代码检查与渲染
8.1 代码结构检查(必须)
使用脚本:scripts/check.py
在渲染之前,必须先检查代码是否包含必要的函数和结构:
# 检查 script.py(默认)
python scripts/check.py
# 检查指定文件
python scripts/check.py my_script.py
检查内容:
- ✅
calculate_geometry()- 几何计算函数是否存在 - ✅
assert_geometry()- 几何验证函数是否存在 - ✅
define_elements()- 图形元素定义函数是否存在 - ✅ 字幕类
Subtitle/TitleSubtitle是否存在 - ✅ 是否有
add_sound()调用(音频集成) - ✅ 是否有继承
Scene的类
检查结果:
- ❌ 错误:必须修复,否则无法渲染
- ⚠️ 警告:建议修复,但不会阻止渲染
8.2 渲染视频
方式1:使用渲染脚本(推荐,包含检查)
# 完整流程:检查 -> 渲染 -> 拷贝到根目录
python scripts/render.py
# 指定文件和场景
python scripts/render.py -f script.py -s MathScene
# 指定渲染质量
python scripts/render.py -q h # 1080p60 (默认)
python scripts/render.py -q k # 4K
python scripts/render.py -q m # 720p30
# 跳过检查(不推荐,仅用于快速测试)
python scripts/render.py --no-check
方式2:直接使用 manim(跳过检查,不推荐)
manim -pqh script.py MathScene
提取关键帧验证
python scripts/extract_frames.py media/videos/script/1080p60/MathScene.mp4 --interval 5
验证内容
- 几何图形是否正确(点、线、圆位置)
- 高亮是否与讲解同步
- 字幕是否清晰可读
- 动画是否流畅
- 音频是否正确添加:
- 每幕都有声音(没有静音幕)
- 音频与分镜中的读白内容一致
- 动画时长 >= 音频时长(没有截断音频)
渲染后必须执行
# 在construct()最后添加:拷贝视频到根目录
import shutil
import os
from pathlib import Path
# 渲染完成后拷贝到根目录
video_src = Path("media/videos/script/1920p60/SquareTriangleProblem.mp4")
video_dst = Path("最终视频.mp4")
if video_src.exists():
shutil.copy2(video_src, video_dst)
print(f"✓ 视频已拷贝到: {video_dst}")
规则:渲染完成后必须将视频拷贝到项目根目录,不要留在media/深处。
如果发现问题
- 回到步骤7修改代码
- 重新渲染验证
数学解题原则(绝对重要)
❌ 禁止使用坐标系
绝不用坐标系来求解,应该用各种定义和推理。
错误示例(坐标法):
设B=(0,0), C=(5,0), A=(1.8, 2.4)...
面积 = ½ × 底 × 高
正确示例(几何推理):
1. 由勾股定理:BC = √(AB² + AC²) = 5
2. 正方形性质:BE = BC = 5
3. 等积变换:S△ABE = S△ABC × (EB/BC) × sin(∠ABE)/sin(∠ABC)
4. 或用向量叉积、海伦公式等纯几何方法
允许的可视化辅助:
- 为了动画展示可以显示坐标,但解题过程不能用坐标计算
- 可以用几何画板的思路:旋转、平移、对称等变换
推荐的几何推理方法
- 等积变换 - 同底等高、等底同高
- 相似三角形 - 比例关系
- 勾股定理 - 边长关系
- 向量/叉积 - 纯几何意义的运算
- 旋转/对称 - 几何变换
文件结构
tutor/
├── SKILL.md # 本文件 - 工作流程定义
├── requirements.txt # Python 依赖
├── references/
│ └── storyboard_sample.md # 分镜脚本示例(参考)
├── templates/
│ └── script_scaffold.py # Manim 脚手架模板(含字幕类)
├── scripts/
│ ├── generate_tts.py # TTS 生成脚本
│ ├── validate_audio.py # 音频验证脚本
│ ├── check.py # 代码结构检查脚本(渲染前必执行)
│ └── render.py # 渲染流水线脚本(检查+渲染+拷贝)
└── sample/ # 示例项目(保留参考)
└── geometry_proof/
依赖管理
使用 uv 管理依赖:
# 创建虚拟环境
uv venv .venv
# 安装依赖
uv pip install -r requirements.txt
# 激活环境
source .venv/bin/activate
绕过LaTeX依赖(重要)
Manim默认需要LaTeX来渲染数学公式。如果不想安装LaTeX,全部使用Text替代MathTex:
# ❌ 需要LaTeX
MathTex(r"BC^2 = AB^2 + AC^2")
MathTex(r"\frac{1}{2} \times 5")
MathTex("A") # 甚至连字母都需要LaTeX
# ✅ 不需要LaTeX
Text("BC² = AB² + AC²", font_size=36)
Text("½ × 5", font_size=30)
Text("A", font_size=32) # 用Text直接显示字母
常用替换对照表:
| 数学符号 | LaTeX写法 | 无LaTeX写法 |
|---|---|---|
| 上标 | x^2 |
x² (直接输入Unicode) |
| 分数 | \frac{1}{2} |
½ 或 1/2 |
| 度数 | 90^\circ |
90° |
| 平方厘米 | \text{cm}^2 |
cm² |
| 根号 | \sqrt{25} |
√25 |
| 角度 | \angle A |
∠A |
脚手架默认不使用MathTex,如需数学公式请直接输入Unicode字符。
关键原则总结
| 原则 | 说明 |
|---|---|
| 数学先行 | 先建立正确的数学模型,再画图 |
| 音频必填 | 每幕必须调用 self.add_sound(),否则视频无声音 |
| 音画同步 | 画面等待音频(动画时长 >= 音频时长),确保讲解和动画同步 |
| 高亮对应 | 配音提到什么,画面高亮什么 |
| 最小验证 | assert_geometry 验证题目条件(带精度) + 画布范围(边界+中心) |
| 逐步抽象 | 从 HTML 可视化 → 分镜脚本 → Manim 代码 |
Weekly Installs
20
Repository
xiaotianfotos/skillsGitHub Stars
379
First Seen
Feb 22, 2026
Security Audits
Installed on
codex20
gemini-cli19
kimi-cli19
github-copilot19
cursor19
opencode19