survey-open-ended-audit
问卷开放题质检专家 V2.1
更新日期:2026-04-08 版本:V2.1 核心更新:大众缩写白名单、纯数字答案检测、态度矛盾检测、书面语密度检测
功能概述
自动检测问卷开放题中的质量问题,支持:
- 自动文件识别 - 自动检测下载目录最新Excel文件
- 智能子题号识别 - 自动识别 A4-1/A4-2/A4-3 等所有子问题
- 7种颜色标记 - 多规则触发时优先标记程度更重的颜色
- 自动发送结果 - 质检完成后直接通过POPO发送结果文件
- 15个行业关键词库 - 手机、汽车、美妆、食品、教育、医疗等
- 灵活字数阈值 - 每次质检可自定义字数阈值
触发条件
当用户提到以下关键词时触发:
- "开放题质检"
- "问卷清洗"
- "检查开放题"
- "审核问卷答案"
- "质检问卷"
- "开放题审核"
处理流程
用户发送文件 + 开放题质检指令
↓
【步骤1】自动识别文件
- 检查 ~/.openclaw/downloads/popo-files/ 最新文件
- 确认文件格式为 .xlsx/.xls
↓
【步骤2】解析质检要求
- 识别是否指定题号(如 A4/A6/B4...)
- 识别调研主题(手机/汽车/美妆等)
- 识别字数阈值(默认5字,可调整)
- 识别重点关注项(乱答题/乱码/AI/态度矛盾等)
↓
【步骤3】执行质检(按优先级标记)
优先级1: 🟤 深红色 - 乱码/无逻辑/纯数字(最严重)
优先级2: 🔴 红色 - 无效答案(字数≤阈值)
优先级3: 🟡 黄色 - 态度矛盾(新增)
优先级4: 🟣 深紫色 - 高度疑似AI(≥3特征)
优先级5: 🔵 蓝色 - 横向一致
优先级6: 💜 浅紫色 - 疑似AI(≥1特征)
优先级7: 🟠 橙色 - 重复答案
↓
【步骤4】生成质检报告
- 保存带高亮标记的Excel文件
- 生成统计摘要
↓
【步骤5】自动发送结果
- 通过POPO发送质检结果文件
- 附带质检统计报告
颜色标记体系(7种颜色)
| 优先级 | 颜色 | 标记 | 规则类型 | 恶劣程度 |
|---|---|---|---|---|
| 1 | 深红色 | 🟤 | 乱码/无逻辑/纯数字 | 最严重 |
| 2 | 红色 | 🔴 | 无效答案(字数≤阈值) | 严重 |
| 3 | 黄色 | 🟡 | 态度矛盾(新增) | 严重 |
| 4 | 深紫色 | 🟣 | 高度疑似AI(≥3特征) | 较重 |
| 5 | 蓝色 | 🔵 | 横向一致 | 中等 |
| 6 | 浅紫色 | 💜 | 疑似AI(≥1特征) | 较轻 |
| 7 | 橙色 | 🟠 | 重复答案 | 轻微 |
处理逻辑
检测答案时:
IF 乱码/无逻辑/纯数字 → 标记 🟤 深红色(最高优先级)
ELSE IF 无效答案 → 标记 🔴 红色
ELSE IF 态度矛盾 → 标记 🟡 黄色
ELSE IF 高度疑似AI → 标记 🟣 深紫色
ELSE IF 横向一致 → 标记 🔵 蓝色
ELSE IF 疑似AI → 标记 💜 浅紫色
ELSE IF 重复答案 → 标记 🟠 橙色
检测规则详解
Rule 1: 乱码/无逻辑检测(优先级1 - 🟤 深红色)
1.1 Unicode乱码检测
- 触发条件:包含"锟斤拷"、"烫烫烫"、"屯屯屯"、"�"等乱码字符
- 标记:🟤 深红色
- 说明:【乱码】包含乱码字符
1.2 键盘乱敲检测
- 触发条件:纯键盘序列(asdfghjkl、qwertyuiop、zxcvbnm)
- 标记:🟤 深红色
- 说明:【乱敲】疑似键盘乱敲
1.3 连续重复标点
- 触发条件:连续5个以上相同标点(如"!!!!!")
- 标记:🟤 深红色
- 说明:【混乱】标点滥用
1.4 中英混杂乱码检测(V2.1优化)
- 检测逻辑:
- 先替换白名单中的英文术语(不区分大小写)
- 检查剩余文本中是否还有中英混杂
- 过滤掉常见短单词(ok、or、to、go等)
- 触发条件:中文+英文(2字母以上)+中文
- 标记:🟤 深红色
- 说明:【乱码】中英混杂(可疑词:xxx)
白名单术语(不区分大小写):
- 手机/数码:iPhone, Pro, Max, Air, Mate, eSIM, 5G, WiFi, OLED, CPU, GPU, A19, 骁龙等
- 汽车:BBA, Tesla, BYD, NIO, L2/L3, NOA, HUD, 激光雷达, CLTC等
- 科技通用:AI, GPT, APP, CPU, GPU, RAM, ROM, VR, AR等
- 大众缩写(V2.1新增):
- 电商:JD/jd(京东)、TB/tb(淘宝)、PDD/pdd(拼多多)、AMZ/amz(亚马逊)
- 社交:WX/wx(微信)、QQ/qq、WB/wb(微博)、B站/b站、DY/dy(抖音)
- 支付:ZFB/zfb(支付宝)
- 出行:DD/dd(滴滴)、高德/GD
- 外卖:MT/mt(美团)、ELM/elm(饿了么)
- 其他:VIP/vip、APP/app、OK/ok、BGM/bgm、VLOG/vlog、KOL/kol、UP主/up主等
1.5 占位符检测
- 触发条件:包含XXX、xxx、待定、TBD、[姓名]、[产品名]、[时间]
- 标记:🟤 深红色
- 说明:【空洞】内容空洞
Rule 2: 纯数字答案检测(优先级1 - 🟤 深红色,V2.1新增)
检测逻辑
- 触发条件:答案为纯数字格式(如"123"、"99.9"、"100元"、"¥50"、"12:30")
- 智能跳过:如果题目涉及以下关键词,则不标记为乱码
- 价格类:价格、多少钱、费用、成本、预算、落地价
- 时间类:时间、时长、多久、日期、周期
- 优惠类:满减、折扣、优惠、券、红包、返利
- 数量类:数量、几个、多少、额度、金额
- 评分类:评分、打分、星级、分数、排名
- 其他:年龄、身高、体重、距离、续航、比例
示例
- 题目"您购买的价格是?" + 答案"5999" → ✅ 正常(题目涉及价格)
- 题目"您满意的原因是什么?" + 答案"100" → 🟤 乱码(纯数字且无意义)
Rule 3: 无效答案检测(优先级2 - 🔴 红色)
3.1 字数检测(灵活阈值)
- 默认阈值:≤5字为无效(可调整)
- 标记:🔴 红色
- 说明:【无效】字数不足(仅N字)
- 调整方式:质检时指定"字数阈值X字"
3.2 无效短语检测
- 触发短语:"追求卓越的"、"不断创新的"、"与时俱进的"
- 标记:🔴 红色
- 说明:【无效】命中无效短语「xxx」
3.3 无意义词库
- 触发词汇:无、没有、不知道、不清楚、略、呵呵、哈哈、嗯、哦、好、ok、none、n/a等
- 标记:🔴 红色
- 说明:【无效】无意义词
Rule 4: 题目-答案态度矛盾检测(优先级3 - 🟡 黄色,V2.1新增)
检测逻辑
-
识别题目类型:
- 正面题目:含"满意"、"喜欢"、"优点"、"优势"、"推荐"、"购买原因"等
- 负面题目:含"不满意"、"不喜欢"、"缺点"、"不足"、"吐槽"、"流失"等
-
识别答案情绪:
- 正面词汇:满意、喜欢、棒、好、优秀、推荐、值得、划算、舒服、流畅、惊喜、开心、信任等
- 负面词汇:讨厌、差、烂、糟糕、失望、后悔、不满、难受、问题、缺陷、卡顿、贵、差评、不足等
-
矛盾判断:
- 正面题目 + 负面答案(无正面词)→ 🟡 黄色
- 负面题目 + 正面答案(无负面词)→ 🟡 黄色
示例
- 题目"满意点有哪些?" + 答案"续航没有想象的那么差" → 🟡 黄色(含负面词"差")
- 题目"不满意的地方?" + 答案"都很满意,没有不满意的" → 🟡 黄色(负面题目+纯正面答案)
- 题目"满意点有哪些?" + 答案"单扬声器有点缺憾,其他完美" → 不标记(混合情绪)
Rule 5: AI生成内容检测(优先级4/6 - 🟣深紫色/💜浅紫色)
5.1 基础设置
- 字数门槛:≥10字才检测AI特征
- 高度疑似AI:≥3个特征 → 🟣 深紫色
- 疑似AI:≥1个特征 → 💜 浅紫色
5.2 结构特征
- 分点列举格式(1. xxx / ① xxx / 一、xxx)
- 特殊符号开头(- • ▪ , ·)
5.3 AI短语库
- 结构词:综上所述、总而言之、由此可见、值得一提的是、不容忽视
- 维度词:从多个维度、全方位、多角度、深层次、全面考虑
- 连接词:此外、不仅如此、更重要的是、具体来说、总的来说
- 代词:该产品、该手机、此产品、此品牌
- 营销词:品质保证、值得信赖、首选品牌、深受喜爱、广受好评
- 表现词:卓越性能、极致体验、完美契合、显著优势、突出表现
5.4 书面语/官方用语密度检测(V2.1新增)
- 触发条件:书面语占比≥15% 且 ≥3个书面语词汇
- 标记:💜 浅紫色
- 说明:【疑似AI】书面语密度高(N个词,占比X%)
书面语词库:
- 结构连接词:首先、其次、再次、第一、第二、一方面、另一方面、与此同时
- 强调词:值得注意的是、需要指出的是、不可否认、毫无疑问
- 评价词:具有一定的、表现出、体现出、得到了、取得了
- 程度词:较为、相当、极其、显著地、明显地
- 转折/因果:然而、因此、因而、从而、由于、因为
- 总结词:总之、综上所述、由此可见、一言以蔽之
- 指代词:其、之、所、该、此、上述、前者、后者
- 动词/名词:进行、予以、加以、情况、问题、方面、领域、机制、体系
- 形容词:良好的、优秀的、完善的、全面的、重要的、关键的
Rule 6: 重复答案检测(优先级7 - 🟠 橙色)
- 触发条件:同一开放题列中,相同答案出现≥3次
- 排除条件:字数≤阈值的不计入
- 标记:🟠 橙色
- 说明:【重复】同题目下重复回答N次
Rule 7: 横向一致性检测(优先级5 - 🔵 蓝色)
- 触发条件:同一行内,多个开放题列的答案完全相同
- 排除条件:字数≤阈值的不计入
- 标记:🔵 蓝色
- 说明:【横向一致】同一行内N个题目答案相同
行业关键词库(15个行业)
1. 手机数码
屏幕、性能、续航、散热、处理器、像素、分辨率、电池、充电、系统、轻薄、手感、外观、设计、颜值、芯片、摄像头、拍照、鸿蒙、iOS、安卓、快充、流畅、卡顿、性价比、品牌、口碑、游戏、办公、售后
2. 汽车
动力、加速、操控、舒适、空间、内饰、外观、续航、里程、电耗、油耗、智能、智驾、辅助驾驶、智能座舱、车机、导航、HUD、雷达、特斯拉、比亚迪、蔚来、小鹏、理想、性价比、家用、通勤、保养
3. 美妆护肤
保湿、补水、美白、抗衰、抗氧化、精华、成分、肌肤、滋润、修复、紧致、提亮、清爽、敏感肌、痘痘、毛孔、细纹、防晒、隔离、遮瑕、持妆、胶原蛋白、玻尿酸、烟酰胺
4. 奶粉母婴
蛋白、乳铁蛋白、益生菌、DHA、ARA、OPO、核苷酸、牛乳、配方、营养成分、吸收、消化、免疫力、肠道、脑部发育、骨骼、钙、铁、锌、维生素、有机、奶源、段数、冲泡
5. 生活服务
点评、美团、抖音、小红书、高德、携程、星级、评分、评价、榜单、推荐、优惠、团购、代金券、折扣、性价比、服务、体验、功能、界面、下单、支付、客服、售后
6. 家电
节能、省电、静音、智能、变频、容量、功率、净化、除菌、制冷、制热、温控、保鲜、烘干、洗涤
7. 食品饮料
口感、味道、香味、甜度、健康、营养、蛋白质、低糖、无糖、低脂、零添加、有机、包装、保质期、品牌、网红、爆款、饮料、奶茶、咖啡、零食、坚果
8. 服装鞋帽
款式、版型、剪裁、设计、风格、面料、材质、棉、麻、丝、舒适、透气、保暖、防水、防晒、性价比、质量、做工、尺码、合身、上衣、裤子、外套、运动鞋、配饰
9. 家居家装
风格、设计、布局、空间、采光、通风、材质、实木、收纳、储物、多功能、耐用、环保、甲醛、沙发、床、床垫、衣柜、灯具、窗帘、地板、瓷砖、厨房、卧室
10. 金融保险
收益、利率、回报率、分红、本金、保额、保费、风险、稳健、理财、基金、股票、保险、重疾险、医疗险、服务、专业、便捷、顾问、规划、银行、支付宝
11. 教育培训
课程、内容、体系、师资、老师、讲师、专业、系统、实用、互动、答疑、辅导、提升、进步、掌握、考证、通过、上岸、就业、服务、试听课、线上、线下、直播
12. 旅游酒店
景点、景区、风景、酒店、民宿、位置、交通、设施、卫生、服务、早餐、体验、放松、度假、亲子、性价比、星级、评分、预订、行程、攻略、自由行
13. 医疗健康
症状、病情、诊断、治疗、康复、医生、专家、医院、诊所、服务、挂号、预约、效果、疗效、安全、副作用、费用、价格、医保、报销、药品、器械
14. 游戏娱乐
手游、端游、网游、RPG、MOBA、FPS、画质、画面、流畅、卡顿、延迟、玩法、操作、剧情、角色、社交、组队、竞技、排位、氪金、充值、抽卡、皮肤、活动
15. 电商零售
淘宝、天猫、京东、拼多多、抖音、商品、SKU、规格、正品、价格、折扣、优惠、满减、券、秒杀、预售、客服、售后、物流、快递、评价、好评、会员、积分
使用示例
基础质检
"质检这份文件"
"质检这份文件,题号B1/C8/D1-1/D1-2"
调整字数阈值
"质检这份文件,字数阈值3字"
"质检这份文件,字数阈值7字"
指定行业
"质检这份文件,手机行业"
"质检这份文件,汽车行业,题号A4/B6"
组合指令
"质检这份文件,手机行业,字数阈值5字,题号B1/C8/D1-1/D1-2"
更新日志
V2.1 (2026-04-08)
- 新增大众缩写白名单:JD/TB/PDD/WX/ZFB/DD/MT等50+常用缩写
- 新增纯数字答案检测:智能识别价格/时间类题目,避免误判
- 新增态度矛盾检测:识别题目与答案情绪不一致的情况(🟡黄色标记)
- 新增书面语密度检测:检测官方用语密度,识别疑似AI答案
- 优化中英混杂检测:支持不区分大小写的白名单匹配
- 扩充行业关键词库:从6个扩展到15个行业
- 新增7种颜色标记:深红、红、黄、深紫、蓝、浅紫、橙
V1 (2026-03-30)
- 基础乱码/无逻辑检测
- 无效答案检测(字数阈值)
- AI生成内容检测
- 重复答案检测
- 横向一致性检测
- 自动文件识别
- 智能子题号识别