w03-testing-and-diagnostics
测试与诊断规范
适用于代码变更后的测试执行与排障,确保结果可靠、补救完整。
⚠️ 核心强制要求
第一步:创建测试任务文档
测试开始前必须先创建 agent-task-log/ongoing/TEST_[日期]_[任务].md
完成后归档至 agent-task-log/archive/[年月]/
# 测试任务:[任务名称]
## 当前状态
**阶段**:🔄 执行测试
**下一步**:运行单元测试
## 进度
| 阶段 | 状态 |
|------|------|
| 执行测试 | 🔄 进行中 |
| 诊断(如需)| ⬜ 待定 |
## 测试记录
(待填写)
第二步:执行测试
- 后端变更(
backend/**)→ 单元测试 - 前端变更(
frontend/**)→ 浏览器测试 - 全栈变更 → 先单元测试,再浏览器测试
第三步:更新文档
测试完成后立即更新文档,记录结果
基线约束
- 测试完成前不得提交交付结果
- 失败时必须先修复再继续
- 无法执行测试时需说明原因和补测计划
AI Agent 行为要求
测试任务开始时
- 先创建 TEST_*.md 文档
- 根据变更类型选择测试
- 执行测试并更新文档
- 失败时触发诊断流程(最多三轮)
诊断流程
每轮:观察 → 推断 → 操作 → 结果
升级条件:
- 三轮排查无果
- 高风险或涉及架构/安全决策
恢复执行
新对话检查 agent-task-log/TEST_*.md,从"当前状态"继续
人机协作
AI 无法 100% 自主完成所有测试,部分场景需要人类协助:
可请求人类协助的情况:
- 浏览器页面需要手动打开或导航
- 需要人工验证视觉效果
- 涉及复杂的用户交互流程
- AI 工具无法访问的系统资源
协作方式:
- 明确告知用户需要协助的具体操作
- 用户完成后,AI 继续后续测试步骤
- 记录协作点到测试文档
原则:半自动化测试同样有效,AI 分担大部分工作,人类补充 AI 难以处理的环节。
与 W00 协同(自动 + 手动)
- 进入测试前可自动调用
w00-workflow-checkpoint checkpoint记录测试起点与下一步。 - 测试失败并进入诊断时,可自动更新 issue 为
status:blocked并记录 blocker。 - 用户可手动执行
/w00-workflow-checkpoint补记测试节点与读档信息。
禁止事项
- ❌ 跳过或延迟测试
- ❌ 未记录结果就报告完成
- ❌ 失败后继续提交
工具脚本
scripts/run_test_workflow.py- 单元测试工作流scripts/run_browser_tests.py- 浏览器测试工作流scripts/auto_diagnose.py- 自动诊断
参考资料
references/testing-workflow.md- 测试工作流详细说明references/browser-testing.md- 浏览器测试详细说明references/diagnosis-workflow.md- 诊断流程详细说明
More from qiao-925/qiao-skills
agent-skill-rules
Agent Skills 开放标准与治理规则。用于 skill 的创建、修改、重构、迁移、审计与维护,并在创建前判断需求应落到自动化、项目级规则、通用或项目私有 skill 还是单次 prompt,提供平台无关的结构标准、frontmatter 规范、渐进式披露与质量门禁。
35python-coding-standards
Python 实现基线能力单元,帮助 Agent 在 Python 代码实现、修改、补全、重构与审查场景中,先对齐项目既有约定,再落实类型边界、日志纪律、命名与结构可读性,避免把个人偏好或项目私货写成通用规范。关键词:Python、编码规范、类型提示、日志、命名、代码结构、项目对齐。
23critical-thinking-guidance
规范 Agent 在解答前进行智能判断与思考引导,避免不必要的替代思考并保留用户主导权。适用于用户提问、方案咨询、学习交流等需要平衡效率与思考深度的场景。关键词:引导提问、智能判断、轻量引导、强制思考
21single-responsibility
单一职责能力单元,帮助 Agent 在文件拆分、函数重构、模块设计、代码审查与边界澄清场景中,识别职责混杂、变化原因耦合与命名失真问题,让文件、函数、类与模块都能围绕一个稳定职责组织。关键词:单一职责、职责拆分、边界澄清、重构、文件拆分、函数重构、模块设计。
20architecture-governance
架构治理能力单元,帮助 Agent 在架构评审、重构、新模块设计、分层边界调整、接口契约设计与项目初始化分析场景中,检查分层与依赖方向、变更影响面、接口契约与可替换性,避免跨层耦合、反向依赖与破坏性演进。关键词:架构治理、分层、依赖方向、影响面分析、接口契约、依赖注入、可插拔、重构。
19core-first-simplicity
核心优先的复杂度控制能力单元,帮助 Agent 在项目取舍、架构设计、模块重构、实现裁剪与方案收敛场景中,先识别主亮点、控制复杂度预算、稳定主路径、延后非核心扩张,避免过度设计与大而全实现。关键词:核心优先、复杂度控制、KISS、方案收敛、过度设计、主路径。
19