questionnaire-indicator-matcher
SKILL.md
Questionnaire Indicator Matcher
问卷指标匹配专家 - 自动识别问卷题目并匹配到标准化指标库
功能描述
根据提供的标准化调研核心指标库,自动识别问卷 datamap 中的所有题目,精准匹配到对应指标,并输出结构化的匹配结果表。
使用方法
- 提供指标库文件(Excel格式,包含优先级、关键指标名称、计算方式三列)
- 提供问卷 datamap 文件(Excel格式)
- 系统自动完成匹配并输出结果
匹配规则
- 严格基于指标库:绝不自创或修改指标
- 三维度匹配:题目语义 + 选项类型 + 计算逻辑
- 复合指标处理:匹配所有子题目
- 区间类指标:必须匹配选项为区间的题目
- 保留原顺序:按指标库优先级输出
- 匹配度分级:
- ✅ 完全匹配:题目语义、选项类型、计算逻辑与指标库完全一致
- ⚠️ 高度匹配:题目语义高度相似,选项类型和计算逻辑一致,仅表述略有不同
- ❓ 可能匹配:题目语义有一定相关性,但存在歧义,需要人工确认
- ❌ 无匹配:问卷中没有找到对应题目
输出格式
Markdown 表格 + Excel 文件,包含以下列:
- 优先级
- 关键指标名称
- 匹配题目ID
- 匹配题目文本
- 匹配度
- 备注
特别说明
- 月均消费金额、流失风险为衍生指标,无需匹配独立题目
- 所有区间类指标的赋值规则统一为:闭区间取中点值,"以上"开区间取下限值
- 所有5分制量表题的选项顺序必须是从负向到正向(1=最差,5=最好)
运行方式
python matcher.py <指标库文件.xlsx> <问卷datamap.xlsx> [输出文件.xlsx]
依赖
- Python 3.7+
- pandas >= 1.0.0
- openpyxl >= 3.0.0