tutor

SKILL.md

Tutor - 一对一辅导老师

核心工作流

WORKFLOW = [
    # 步骤1: 数学建模
    {
        "step": 1,
        "name": "analyze_problem",
        "input": "题目图片/文本",
        "output": "math_analysis.md",
        "tasks": ["推导数学事实", "建立几何模型", "确定图形构建方法"]
    },

    # 步骤2: HTML可视化
    {
        "step": 2,
        "name": "html_visualization",
        "input": "math_analysis.md",
        "output": "数学_{日期}_{题目}.html",
        "tasks": ["SVG画图形", "展示画图过程", "标注关键要素"]
    },

    # 步骤3: 分镜脚本
    {
        "step": 3,
        "name": "storyboard",
        "input": "HTML内容",
        "output": "{日期}_{题目}_分镜.md",
        "tasks": ["定义幕结构(不限制幕数)", "设计画面/字幕/读白", "音频清单(时长留空)"]
    },

    # 步骤4: TTS生成
    {
        "step": 4,
        "name": "generate_tts",
        "input": "分镜脚本",
        "output": "audio/audio_{三位幕号}_{幕名}.wav + audio_info.json",
        "command": "python scripts/generate_tts.py audio_list.csv ./audio --voice xiaoxiao"
    },

    # 步骤5: 验证更新
    {
        "step": 5,
        "name": "validate_audio",
        "input": "分镜.md + audio/",
        "output": "更新后的分镜.md(填充时长) + audio_info.json",
        "command": "python scripts/validate_audio.py 分镜.md ./audio",
        "check": ["音频存在性", "时长>0", "数量匹配"]
    },

    # 步骤6: 脚手架
    {
        "step": 6,
        "name": "scaffold",
        "input": "分镜.md + audio_info.json",
        "output": "script.py (伪代码框架)",
        "template": "templates/script_scaffold.py",
        "must_include": [
            "calculate_geometry() - 几何建模",
            "assert_geometry() - 几何验证(题目条件+精度) + 画布范围检查(边界+中心)",
            "COLORS - 颜色定义",
            "SCENES[] - 幕信息数组(从audio_info.json加载时长)",

        ]
    },

    # 步骤7: 生成代码
    {
        "step": 7,
        "name": "implement",
        "input": "script.py脚手架 + 分镜.md + audio_info.json",
        "output": "完整的script.py",
        "rules": [
            "根据分镜实现每幕动画",
            "读白提到什么就高亮什么",
            "画面时长 >= 音频时长",
            "calculate_geometry()必须完整实现"
        ]
    },

    # 步骤8: 检查与渲染
    {
        "step": 8,
        "name": "check_and_render",
        "input": "script.py",
        "output": "视频文件 + 关键帧截图",
        "command": "python scripts/render.py",
        "check": ["代码结构检查(check.py)", "几何正确性", "高亮同步", "字幕清晰", "动画流畅"],
        "on_fail": "回到步骤7修改代码"
    }
]

# 工作流状态转换
# step1 → step2 → step3 → step4 → step5 → step6 → step7 → step8
#                                          ↑____________↓ (失败时循环)

步骤1:分析题目,推导数学事实

目标:建立正确的数学计算方法和流程,形成画出符合数学的图形的方法。

输出格式

## 数学事实分析

### 已知条件
- 条件1:...
- 条件2:...

### 推导的事实
1. **事实名称**: 描述
   - 计算过程: ...
   - 数学表达: ...

### 图形构建方法
- 点的坐标: ...
- 边的关系: ...
- 圆/弧的定义: ...

### 需要证明的结论
- 结论1: ...

注意:所有证明题需要证明的结论,在分镜中都可以作为已确立的事实来使用。


步骤2:HTML + SVG 可视化

目标:用 HTML + SVG 画出图形,展示画图过程和解答流程,为分镜做规划。 补充:如果用户已经提供了准确的HTML文件,描述了画图过程,可以按文件名要求复制一份,跳过生成文件。

输出要求

  • 文件命名:数学_{日期}_{题目简述}.html
  • 包含:题目陈述、SVG 图形、分步解答、关键要素标注
  • SVG 需要展示画图过程(如:先画三角形 → 再画圆 → 标注点)

步骤3:生成分镜脚本

目标:定义视频结构,不限制幕数,结尾预留音频文件名(时长为空)。

文件命名

{日期}_{题目}_分镜.md

分镜脚本结构

# 分镜脚本 - {题目名称}

## 分镜设计

### 第1幕:{幕名}
**画面**: ...
**字幕**: ...(简洁,≤20字)
**读白**: ...(详细,口语化)
**动画**: ...
**目的**: ...

---

## 音频生成清单(步骤4填写)

| 幕号 | 文件名 | 读白文本 | 时长 | 说话人 | 情感 |
|------|--------|----------|------|--------|------|
| 1 | audio_001_{幕名}.wav | "读白文本" | | xiaoxiao | 热情 |
| 2 | audio_002_{幕名}.wav | "读白文本" | | xiaoxiao | 平和 |

关键规范

  • 幕号从1开始连续编号
  • 文件名格式:audio_{三位幕号}_{幕名}.wav
  • 时长列为空,由步骤5填充
  • 不限制幕数,根据内容需要决定

字幕退场约定(重要)

为了避免动画中文字忘记退场,在分镜的动画部分使用以下约定指定退场时机:

**动画**:
- 0.0s: 字幕"勾股定理"淡入
- 2.0s: → 字幕退场(或:字幕淡出)
- 3.0s: 图形高亮

退场标记方式(三选一):

  1. 箭头符号表示退场(推荐,最简洁)
  2. 退场:淡出: 显式标记
  3. 持续X秒 指定显示时长

示例

**动画**:
- 字幕"正方形性质"淡入,持续3秒 → 自动退场
- 0.0s: 标题淡入 | 3.0s: →
- 公式分步显示,第5秒全部退场

参考示例

references/storyboard_sample.md - 第九十九题:证明四点共圆


步骤4:TTS 生成语音文件

使用脚本scripts/generate_tts.py(Edge TTS 推荐)

执行命令

python scripts/generate_tts.py 分镜.md ./audio --voice xiaoxiao

输出文件

audio/
├── audio_001_开场.wav
├── audio_002_展示图形.wav
├── audio_003_定理证明.wav
├── ...
└── audio_info.json

audio_info.json 格式

{
  "files": [
    {"scene": 1, "file": "audio_001_开场.wav", "duration": 8.5},
    {"scene": 2, "file": "audio_002_展示图形.wav", "duration": 15.2}
  ]
}

步骤5:验证并更新分镜时长

使用脚本scripts/validate_audio.py

功能

  1. 读取 audio/audio_info.json 获取音频时长
  2. 验证所有音频文件存在且时长正常(>0秒)
  3. 更新分镜脚本的"音频生成清单"中的时长列
  4. 如果缺少音频或时长异常,报错提醒

执行命令

python scripts/validate_audio.py 分镜.md ./audio

验证失败情况

  • 缺少音频文件 → 报错:"缺少第X幕音频文件"
  • 时长为0或异常 → 报错:"第X幕音频时长异常,请检查格式"
  • 分镜与音频数量不匹配 → 报错:"分镜X幕,音频Y个,数量不匹配"

步骤6:生成 script.py 脚手架

使用模板templates/script_scaffold.py

输出script.py(肯定 build 不过的伪代码框架)

脚手架必须包含的部分

from manim import *
import json
import os

class MathScene(Scene):
    """
    数学教学视频场景 - 脚手架
    根据分镜脚本和音频信息生成完整动画
    """

    # ========== 1. 颜色定义 ==========
    COLORS = {
        'background': '#1a1a2e',      # 深蓝背景
        'primary': '#4ecca3',          # 主色(青色)
        'secondary': '#e94560',        # 辅助色(红色)
        'highlight': '#ffc107',        # 高亮色(黄色)
        'text': '#ffffff',             # 文字白色
        'grid': '#2a2a4e',             # 网格线
    }

    # ========== 2. 幕信息数组(供AI参考) ==========
    # 格式: (幕号, 幕名, 音频文件名, 时长秒数)
    # 注意:时长从 audio_info.json 读取,确保画面等待音频原则
    SCENES = [
        (1, "开场", "audio_001_开场.wav", None),
        (2, "展示图形", "audio_002_展示图形.wav", None),
        # ... 根据分镜动态生成
    ]

    def __init__(self, **kwargs):
        super().__init__(**kwargs)
        # 加载音频时长信息
        self.audio_timings = self._load_audio_timings()

    def _load_audio_timings(self):
        """从 audio_info.json 加载音频时长"""
        # TODO: AI实现 - 读取JSON并填充 SCENES 的时长
        pass

    # ========== 3. 几何计算函数 ==========
    def calculate_geometry(self):
        """
        计算所有几何元素的位置和属性

        从步骤2的HTML画图中提取信息,建立数学模型:
        - 所有点的坐标 (x, y) - ⚠️ 始终使用2D,z坐标始终为0
        - 边的长度和方程
        - 圆/弧的圆心和半径
        - 交点计算
        - 切线、法线等辅助线

        返回: dict 包含所有几何对象的数据
        """
        # TODO: AI根据题目几何关系实现
        geometry = {
            'points': {},      # {'A': (x, y), 'B': (x, y), ...}
            'lines': {},       # {'AB': {'start': A, 'end': B, 'length': L}, ...}
            'circles': {},     # {'circle1': {'center': O, 'radius': r}, ...}
            'arcs': {},        # 圆弧定义
        }
        return geometry

    # ========== 4. 几何验证函数 ==========
    def assert_geometry(self, geometry):
        """
        验证几何计算的正确性(最小验证原则)

        验证内容:
        1. 题目给定的事实(如:两条边相等,谁是谁的一半)
        2. 精度问题:使用相对误差比较,而非绝对相等
        3. 画布范围检查:确保图形在可视区域内
        4. 错误提示:所有assert必须用中文描述问题,包含具体数值和修复建议

        === 几何条件验证 ===
        基于题目给定的条件,编写最小但关键的验证:
        - 如果题目说 AB = BC,验证 |AB - BC| < epsilon
        - 如果题目说 E 是中点,验证 AE = EB(考虑浮点误差)
        - 如果题目说某角是直角,验证向量点积接近0
        - 如果题目给具体数值(如边长为5),验证计算结果匹配

        精度建议:
        - 相对误差:1e-6 或绝对误差 1e-4
        - 示例:assert abs(len_AB - len_BC) < 1e-4, "中文错误提示:AB长度不等于BC长度"

        === 画布范围验证算法 ===
        目标:确保整个图形在画布内,且位于视觉中心区域

        算法步骤(AI需要根据几何数据实现):
        1. 计算所有几何元素的外接矩形 bounding_box
           - 遍历所有点、线、圆的边界点
           - 取最小x, 最大x, 最小y, 最大y

        2. 验证矩形在画布范围内(考虑边距)
           - 画布默认范围:FRAME_WIDTH=14.2, FRAME_HEIGHT=8
           - 建议边距:四周各留 0.5-1.0 单位
           - 验证:min_x > -7+margin 且 max_x < 7-margin
                   min_y > -4+margin 且 max_y < 4-margin

        3. 验证矩形中心在视觉中心区域
           - 画布中心:(0, 0)
           - 视觉中心区域:中心 ±20%(即 x∈[-1.4, 1.4], y∈[-0.8, 0.8])
           - 计算矩形中心:(center_x, center_y) = ((min_x+max_x)/2, (min_y+max_y)/2)
           - 验证:center_x ∈ [-1.4, 1.4] 且 center_y ∈ [-0.8, 0.8]

        4. 如果图形超出范围,AI需要调整几何计算的缩放或平移
        """
        # === TODO: AI实现 - 基于题目条件的验证(失败时用中文报错)===
        # 示例代码(根据实际题目修改):
        # epsilon = 1e-4
        # len_ab = geometry['lines']['AB']['length']
        # len_bc = geometry['lines']['BC']['length']
        # assert abs(len_ab - len_bc) < epsilon, f"几何验证失败:AB长度({len_ab:.4f})不等于BC长度({len_bc:.4f}),题目要求两边相等"
        #
        # len_ae = geometry['lines']['AE']['length']
        # len_ab = geometry['lines']['AB']['length']
        # assert abs(len_ae * 2 - len_ab) < epsilon, f"几何验证失败:E不是AB中点,AE({len_ae:.4f})*2={len_ae*2:.4f} != AB({len_ab:.4f})"

        # === TODO: AI实现 - 画布范围检查(失败时用中文报错)===
        # 1. 计算bounding_box
        #    all_points = list(geometry['points'].values())
        #    min_x = min(p[0] for p in all_points)
        #    max_x = max(p[0] for p in all_points)
        #    min_y = min(p[1] for p in all_points)
        #    max_y = max(p[1] for p in all_points)
        #
        # 2. 验证画布边界(失败时报具体数值)
        #    margin = 0.5
        #    assert min_x > -7 + margin, f"画布验证失败:图形左边界(min_x={min_x:.2f})超出安全区域(>{-7+margin}),需要向右平移或缩小"
        #    assert max_x < 7 - margin, f"画布验证失败:图形右边界(max_x={max_x:.2f})超出安全区域(<{7-margin}),需要向左平移或缩小"
        #    assert min_y > -4 + margin, f"画布验证失败:图形下边界(min_y={min_y:.2f})超出安全区域(>{-4+margin}),需要向上平移或缩小"
        #    assert max_y < 4 - margin, f"画布验证失败:图形上边界(max_y={max_y:.2f})超出安全区域(<{4-margin}),需要向下平移或缩小"
        #
        # 3. 验证视觉中心(失败时报具体偏移)
        #    center_x = (min_x + max_x) / 2
        #    center_y = (min_y + max_y) / 2
        #    assert -1.4 <= center_x <= 1.4, f"视觉中心验证失败:图形中心X={center_x:.2f}超出视觉中心区域[-1.4, 1.4],建议调整几何计算使图形居中"
        #    assert -0.8 <= center_y <= 0.8, f"视觉中心验证失败:图形中心Y={center_y:.2f}超出视觉中心区域[-0.8, 0.8],建议调整几何计算使图形居中"

        pass

    # ========== 5. 图形元素定义 ==========
    def define_elements(self, geometry):
        """
        定义 Manim 图形对象(但不创建动画)

        为每一幕需要的图形元素预先定义,便于结构化调用:
        - 点、线、圆的基础对象
        - 高亮效果对象
        - 标注文字对象
        """
        # TODO: AI根据分镜需求定义
        elements = {
            'points': {},      # Mobject 点对象
            'lines': {},       # Mobject 线对象
            'circles': {},     # Mobject 圆对象
            'labels': {},      # 标签文字
        }
        return elements

    # ========== 6. 构造主流程 ==========
    def construct(self):
        """主构造流程"""
        # 计算几何
        geometry = self.calculate_geometry()
        self.assert_geometry(geometry)
        elements = self.define_elements(geometry)

        # 设置背景
        self.camera.background_color = self.COLORS['background']

        # 按幕执行
        for scene_num, scene_name, audio_file, duration in self.SCENES:
            self.play_scene(scene_num, scene_name, audio_file, duration, elements, geometry)

    def play_scene(self, scene_num, scene_name, audio_file, duration, elements, geometry):
        """
        播放单幕动画 - 必须添加音频

        ========== 音频集成(强制要求) ==========
        每幕必须添加对应的音频文件,否则视频将没有声音!

        方式:在方法第一行就添加音频
            self.add_sound(f"audio/{audio_file}")

        注意:
        - audio_file 参数已经包含文件名(如 "audio_001_开场.wav")
        - 音频文件位于 audio/ 目录下
        - 添加音频后,后续动画时长应 >= duration(音频时长)

        ========== 画面等待音频原则 ==========
        - 动画总时长 >= 音频时长(duration 参数)
        - 可以画面多等待(多出静音部分,后期可剪辑)
        - 不能画面比音频短(会导致音频被截断)

        ========== 高亮规范(必须在读白提到时同步) ==========
        - 提到某个边等于某个边 → 用动画高亮两条边
        - 提到某个点/圆 → 闪烁或放大高亮
        - 提到证明结论 → 用框或颜色强调

        ========== 绘制策略 ==========
        - 简单图形:直接显示,然后高亮关键部分
        - 复杂图形:逐步绘制,边画边讲解
        """
        # TODO: AI实现 - 第一行必须添加音频!
        # self.add_sound(f"audio/{audio_file}")
        pass

    # ========== 7. 音频集成 ==========
    def add_audio_to_scene(self, audio_file, animation_duration):
        """
        添加音频到场景

        方式1(推荐):在script.py中直接添加音频文件
        self.add_sound(audio_file)

        方式2:如果需要在特定时间点触发,使用延时

        确保:animation_duration >= 音频实际时长
        """
        # TODO: AI实现音频集成
        pass

    

步骤7:AI 生成最终代码

输入

  • 分镜脚本(已更新时长)
  • audio/audio_info.json
  • script.py 脚手架

输出:完整的 script.py

AI 生成指导

  1. 根据分镜的"动画"描述实现具体动画代码
  2. 根据"读白"内容确定高亮时机
  3. 实现 calculate_geometry() 的具体计算
  4. 实现 assert_geometry() 的验证逻辑
  5. 为每幕实现 play_scene_X() 方法
  6. 音频集成(必须)
    • 每幕的第一行必须是 self.add_sound(f"audio/{audio_file}")
    • 确保动画总时长 >= 音频时长(使用 duration 参数)
    • 如果动画太短,添加 self.wait() 来延长
  7. 验证音频文件路径正确:audio/audio_001_XXX.wav
  8. 字幕显示与退场(关键)
    • 使用脚手架提供的 show_subtitle_timed(text, duration) 方法显示定时字幕
    • 或使用 show_subtitle_with_audio(text, audio_duration) 让字幕持续到音频结束
    • 分镜中的 退场: 标记表示文字需要在该时间点淡出
    • 必须确保所有文字元素都有退场动画,避免残留到下一幕

步骤8:代码检查与渲染

8.1 代码结构检查(必须)

使用脚本scripts/check.py

在渲染之前,必须先检查代码是否包含必要的函数和结构:

# 检查 script.py(默认)
python scripts/check.py

# 检查指定文件
python scripts/check.py my_script.py

检查内容

  1. calculate_geometry() - 几何计算函数是否存在
  2. assert_geometry() - 几何验证函数是否存在
  3. define_elements() - 图形元素定义函数是否存在
  4. ✅ 字幕类 Subtitle / TitleSubtitle 是否存在
  5. ✅ 是否有 add_sound() 调用(音频集成)
  6. ✅ 是否有继承 Scene 的类

检查结果

  • ❌ 错误:必须修复,否则无法渲染
  • ⚠️ 警告:建议修复,但不会阻止渲染

8.2 渲染视频

方式1:使用渲染脚本(推荐,包含检查)

# 完整流程:检查 -> 渲染 -> 拷贝到根目录
python scripts/render.py

# 指定文件和场景
python scripts/render.py -f script.py -s MathScene

# 指定渲染质量
python scripts/render.py -q h    # 1080p60 (默认)
python scripts/render.py -q k    # 4K
python scripts/render.py -q m    # 720p30

# 跳过检查(不推荐,仅用于快速测试)
python scripts/render.py --no-check

方式2:直接使用 manim(跳过检查,不推荐)

manim -pqh script.py MathScene

提取关键帧验证

python scripts/extract_frames.py media/videos/script/1080p60/MathScene.mp4 --interval 5

验证内容

  1. 几何图形是否正确(点、线、圆位置)
  2. 高亮是否与讲解同步
  3. 字幕是否清晰可读
  4. 动画是否流畅
  5. 音频是否正确添加
    • 每幕都有声音(没有静音幕)
    • 音频与分镜中的读白内容一致
    • 动画时长 >= 音频时长(没有截断音频)

渲染后必须执行

# 在construct()最后添加:拷贝视频到根目录
import shutil
import os
from pathlib import Path

# 渲染完成后拷贝到根目录
video_src = Path("media/videos/script/1920p60/SquareTriangleProblem.mp4")
video_dst = Path("最终视频.mp4")
if video_src.exists():
    shutil.copy2(video_src, video_dst)
    print(f"✓ 视频已拷贝到: {video_dst}")

规则:渲染完成后必须将视频拷贝到项目根目录,不要留在media/深处。

如果发现问题

  • 回到步骤7修改代码
  • 重新渲染验证

数学解题原则(绝对重要)

❌ 禁止使用坐标系

绝不用坐标系来求解,应该用各种定义和推理。

错误示例(坐标法):

设B=(0,0), C=(5,0), A=(1.8, 2.4)...
面积 = ½ × 底 × 高

正确示例(几何推理):

1. 由勾股定理:BC = √(AB² + AC²) = 5
2. 正方形性质:BE = BC = 5
3. 等积变换:S△ABE = S△ABC × (EB/BC) × sin(∠ABE)/sin(∠ABC)
4. 或用向量叉积、海伦公式等纯几何方法

允许的可视化辅助

  • 为了动画展示可以显示坐标,但解题过程不能用坐标计算
  • 可以用几何画板的思路:旋转、平移、对称等变换

推荐的几何推理方法

  1. 等积变换 - 同底等高、等底同高
  2. 相似三角形 - 比例关系
  3. 勾股定理 - 边长关系
  4. 向量/叉积 - 纯几何意义的运算
  5. 旋转/对称 - 几何变换

文件结构

tutor/
├── SKILL.md                          # 本文件 - 工作流程定义
├── requirements.txt                  # Python 依赖
├── references/
│   └── storyboard_sample.md          # 分镜脚本示例(参考)
├── templates/
│   └── script_scaffold.py            # Manim 脚手架模板(含字幕类)
├── scripts/
│   ├── generate_tts.py               # TTS 生成脚本
│   ├── validate_audio.py             # 音频验证脚本
│   ├── check.py                      # 代码结构检查脚本(渲染前必执行)
│   └── render.py                     # 渲染流水线脚本(检查+渲染+拷贝)
└── sample/                           # 示例项目(保留参考)
    └── geometry_proof/

依赖管理

使用 uv 管理依赖:

# 创建虚拟环境
uv venv .venv

# 安装依赖
uv pip install -r requirements.txt

# 激活环境
source .venv/bin/activate

绕过LaTeX依赖(重要)

Manim默认需要LaTeX来渲染数学公式。如果不想安装LaTeX,全部使用Text替代MathTex

# ❌ 需要LaTeX
MathTex(r"BC^2 = AB^2 + AC^2")
MathTex(r"\frac{1}{2} \times 5")
MathTex("A")  # 甚至连字母都需要LaTeX

# ✅ 不需要LaTeX
Text("BC² = AB² + AC²", font_size=36)
Text("½ × 5", font_size=30)
Text("A", font_size=32)  # 用Text直接显示字母

常用替换对照表

数学符号 LaTeX写法 无LaTeX写法
上标 x^2 (直接输入Unicode)
分数 \frac{1}{2} ½1/2
度数 90^\circ 90°
平方厘米 \text{cm}^2 cm²
根号 \sqrt{25} √25
角度 \angle A ∠A

脚手架默认不使用MathTex,如需数学公式请直接输入Unicode字符。


关键原则总结

原则 说明
数学先行 先建立正确的数学模型,再画图
音频必填 每幕必须调用 self.add_sound(),否则视频无声音
音画同步 画面等待音频(动画时长 >= 音频时长),确保讲解和动画同步
高亮对应 配音提到什么,画面高亮什么
最小验证 assert_geometry 验证题目条件(带精度) + 画布范围(边界+中心)
逐步抽象 从 HTML 可视化 → 分镜脚本 → Manim 代码
Weekly Installs
20
GitHub Stars
379
First Seen
Feb 22, 2026
Installed on
codex20
gemini-cli19
kimi-cli19
github-copilot19
cursor19
opencode19