问卷开放题质检专家 V2.1

更新日期：2026-04-08 版本：V2.1 核心更新：大众缩写白名单、纯数字答案检测、态度矛盾检测、书面语密度检测

功能概述

自动检测问卷开放题中的质量问题，支持：

自动文件识别 - 自动检测下载目录最新Excel文件
智能子题号识别 - 自动识别 A4-1/A4-2/A4-3 等所有子问题
7种颜色标记 - 多规则触发时优先标记程度更重的颜色
自动发送结果 - 质检完成后直接通过POPO发送结果文件
15个行业关键词库 - 手机、汽车、美妆、食品、教育、医疗等
灵活字数阈值 - 每次质检可自定义字数阈值

触发条件

当用户提到以下关键词时触发：

"开放题质检"
"问卷清洗"
"检查开放题"
"审核问卷答案"
"质检问卷"
"开放题审核"

处理流程

用户发送文件 + 开放题质检指令
  ↓
【步骤1】自动识别文件
  - 检查 ~/.openclaw/downloads/popo-files/ 最新文件
  - 确认文件格式为 .xlsx/.xls
  ↓
【步骤2】解析质检要求
  - 识别是否指定题号（如 A4/A6/B4...）
  - 识别调研主题（手机/汽车/美妆等）
  - 识别字数阈值（默认5字，可调整）
  - 识别重点关注项（乱答题/乱码/AI/态度矛盾等）
  ↓
【步骤3】执行质检（按优先级标记）
  优先级1: 🟤 深红色 - 乱码/无逻辑/纯数字（最严重）
  优先级2: 🔴 红色 - 无效答案（字数≤阈值）
  优先级3: 🟡 黄色 - 态度矛盾（新增）
  优先级4: 🟣 深紫色 - 高度疑似AI（≥3特征）
  优先级5: 🔵 蓝色 - 横向一致
  优先级6: 💜 浅紫色 - 疑似AI（≥1特征）
  优先级7: 🟠 橙色 - 重复答案
  ↓
【步骤4】生成质检报告
  - 保存带高亮标记的Excel文件
  - 生成统计摘要
  ↓
【步骤5】自动发送结果
  - 通过POPO发送质检结果文件
  - 附带质检统计报告

颜色标记体系（7种颜色）

优先级	颜色	标记	规则类型	恶劣程度
1	深红色	🟤	乱码/无逻辑/纯数字	最严重
2	红色	🔴	无效答案（字数≤阈值）	严重
3	黄色	🟡	态度矛盾（新增）	严重
4	深紫色	🟣	高度疑似AI（≥3特征）	较重
5	蓝色	🔵	横向一致	中等
6	浅紫色	💜	疑似AI（≥1特征）	较轻
7	橙色	🟠	重复答案	轻微

处理逻辑

检测答案时：
  IF 乱码/无逻辑/纯数字 → 标记 🟤 深红色（最高优先级）
  ELSE IF 无效答案 → 标记 🔴 红色
  ELSE IF 态度矛盾 → 标记 🟡 黄色
  ELSE IF 高度疑似AI → 标记 🟣 深紫色
  ELSE IF 横向一致 → 标记 🔵 蓝色
  ELSE IF 疑似AI → 标记 💜 浅紫色
  ELSE IF 重复答案 → 标记 🟠 橙色

检测规则详解

Rule 1: 乱码/无逻辑检测（优先级1 - 🟤 深红色）

1.1 Unicode乱码检测

触发条件：包含"锟斤拷"、"烫烫烫"、"屯屯屯"、"�"等乱码字符
标记：🟤 深红色
说明：【乱码】包含乱码字符

1.2 键盘乱敲检测

触发条件：纯键盘序列（asdfghjkl、qwertyuiop、zxcvbnm）
标记：🟤 深红色
说明：【乱敲】疑似键盘乱敲

1.3 连续重复标点

触发条件：连续5个以上相同标点（如"！！！！！"）
标记：🟤 深红色
说明：【混乱】标点滥用

1.4 中英混杂乱码检测（V2.1优化）

检测逻辑：
1. 先替换白名单中的英文术语（不区分大小写）
2. 检查剩余文本中是否还有中英混杂
3. 过滤掉常见短单词（ok、or、to、go等）
触发条件：中文+英文(2字母以上)+中文
标记：🟤 深红色
说明：【乱码】中英混杂(可疑词:xxx)

白名单术语（不区分大小写）：

手机/数码：iPhone, Pro, Max, Air, Mate, eSIM, 5G, WiFi, OLED, CPU, GPU, A19, 骁龙等
汽车：BBA, Tesla, BYD, NIO, L2/L3, NOA, HUD, 激光雷达, CLTC等
科技通用：AI, GPT, APP, CPU, GPU, RAM, ROM, VR, AR等
大众缩写（V2.1新增）：
- 电商：JD/jd（京东）、TB/tb（淘宝）、PDD/pdd（拼多多）、AMZ/amz（亚马逊）
- 社交：WX/wx（微信）、QQ/qq、WB/wb（微博）、B站/b站、DY/dy（抖音）
- 支付：ZFB/zfb（支付宝）
- 出行：DD/dd（滴滴）、高德/GD
- 外卖：MT/mt（美团）、ELM/elm（饿了么）
- 其他：VIP/vip、APP/app、OK/ok、BGM/bgm、VLOG/vlog、KOL/kol、UP主/up主等

1.5 占位符检测

触发条件：包含XXX、xxx、待定、TBD、[姓名]、[产品名]、[时间]
标记：🟤 深红色
说明：【空洞】内容空洞

Rule 2: 纯数字答案检测（优先级1 - 🟤 深红色，V2.1新增）

检测逻辑

触发条件：答案为纯数字格式（如"123"、"99.9"、"100元"、"￥50"、"12:30"）
智能跳过：如果题目涉及以下关键词，则不标记为乱码
- 价格类：价格、多少钱、费用、成本、预算、落地价
- 时间类：时间、时长、多久、日期、周期
- 优惠类：满减、折扣、优惠、券、红包、返利
- 数量类：数量、几个、多少、额度、金额
- 评分类：评分、打分、星级、分数、排名
- 其他：年龄、身高、体重、距离、续航、比例

示例

题目"您购买的价格是？" + 答案"5999" → ✅ 正常（题目涉及价格）
题目"您满意的原因是什么？" + 答案"100" → 🟤 乱码（纯数字且无意义）

Rule 3: 无效答案检测（优先级2 - 🔴 红色）

3.1 字数检测（灵活阈值）

默认阈值：≤5字为无效（可调整）
标记：🔴 红色
说明：【无效】字数不足(仅N字)
调整方式：质检时指定"字数阈值X字"

3.2 无效短语检测

触发短语："追求卓越的"、"不断创新的"、"与时俱进的"
标记：🔴 红色
说明：【无效】命中无效短语「xxx」

3.3 无意义词库

触发词汇：无、没有、不知道、不清楚、略、呵呵、哈哈、嗯、哦、好、ok、none、n/a等
标记：🔴 红色
说明：【无效】无意义词

Rule 4: 题目-答案态度矛盾检测（优先级3 - 🟡 黄色，V2.1新增）

检测逻辑

识别题目类型：
- 正面题目：含"满意"、"喜欢"、"优点"、"优势"、"推荐"、"购买原因"等
- 负面题目：含"不满意"、"不喜欢"、"缺点"、"不足"、"吐槽"、"流失"等
识别答案情绪：
- 正面词汇：满意、喜欢、棒、好、优秀、推荐、值得、划算、舒服、流畅、惊喜、开心、信任等
- 负面词汇：讨厌、差、烂、糟糕、失望、后悔、不满、难受、问题、缺陷、卡顿、贵、差评、不足等
矛盾判断：
- 正面题目 + 负面答案（无正面词）→ 🟡 黄色
- 负面题目 + 正面答案（无负面词）→ 🟡 黄色

示例

题目"满意点有哪些？" + 答案"续航没有想象的那么差" → 🟡 黄色（含负面词"差"）
题目"不满意的地方？" + 答案"都很满意，没有不满意的" → 🟡 黄色（负面题目+纯正面答案）
题目"满意点有哪些？" + 答案"单扬声器有点缺憾，其他完美" → 不标记（混合情绪）

Rule 5: AI生成内容检测（优先级4/6 - 🟣深紫色/💜浅紫色）

5.1 基础设置

字数门槛：≥10字才检测AI特征
高度疑似AI：≥3个特征 → 🟣 深紫色
疑似AI：≥1个特征 → 💜 浅紫色

5.2 结构特征

分点列举格式（1. xxx / ① xxx / 一、xxx）
特殊符号开头（- • ▪ ， ·）

5.3 AI短语库

结构词：综上所述、总而言之、由此可见、值得一提的是、不容忽视
维度词：从多个维度、全方位、多角度、深层次、全面考虑
连接词：此外、不仅如此、更重要的是、具体来说、总的来说
代词：该产品、该手机、此产品、此品牌
营销词：品质保证、值得信赖、首选品牌、深受喜爱、广受好评
表现词：卓越性能、极致体验、完美契合、显著优势、突出表现

5.4 书面语/官方用语密度检测（V2.1新增）

触发条件：书面语占比≥15% 且 ≥3个书面语词汇
标记：💜 浅紫色
说明：【疑似AI】书面语密度高(N个词,占比X%)

书面语词库：

结构连接词：首先、其次、再次、第一、第二、一方面、另一方面、与此同时
强调词：值得注意的是、需要指出的是、不可否认、毫无疑问
评价词：具有一定的、表现出、体现出、得到了、取得了
程度词：较为、相当、极其、显著地、明显地
转折/因果：然而、因此、因而、从而、由于、因为
总结词：总之、综上所述、由此可见、一言以蔽之
指代词：其、之、所、该、此、上述、前者、后者
动词/名词：进行、予以、加以、情况、问题、方面、领域、机制、体系
形容词：良好的、优秀的、完善的、全面的、重要的、关键的

Rule 6: 重复答案检测（优先级7 - 🟠 橙色）

触发条件：同一开放题列中，相同答案出现≥3次
排除条件：字数≤阈值的不计入
标记：🟠 橙色
说明：【重复】同题目下重复回答N次

Rule 7: 横向一致性检测（优先级5 - 🔵 蓝色）

触发条件：同一行内，多个开放题列的答案完全相同
排除条件：字数≤阈值的不计入
标记：🔵 蓝色
说明：【横向一致】同一行内N个题目答案相同

行业关键词库（15个行业）

1. 手机数码

屏幕、性能、续航、散热、处理器、像素、分辨率、电池、充电、系统、轻薄、手感、外观、设计、颜值、芯片、摄像头、拍照、鸿蒙、iOS、安卓、快充、流畅、卡顿、性价比、品牌、口碑、游戏、办公、售后

2. 汽车

动力、加速、操控、舒适、空间、内饰、外观、续航、里程、电耗、油耗、智能、智驾、辅助驾驶、智能座舱、车机、导航、HUD、雷达、特斯拉、比亚迪、蔚来、小鹏、理想、性价比、家用、通勤、保养

3. 美妆护肤

保湿、补水、美白、抗衰、抗氧化、精华、成分、肌肤、滋润、修复、紧致、提亮、清爽、敏感肌、痘痘、毛孔、细纹、防晒、隔离、遮瑕、持妆、胶原蛋白、玻尿酸、烟酰胺

4. 奶粉母婴

蛋白、乳铁蛋白、益生菌、DHA、ARA、OPO、核苷酸、牛乳、配方、营养成分、吸收、消化、免疫力、肠道、脑部发育、骨骼、钙、铁、锌、维生素、有机、奶源、段数、冲泡

5. 生活服务

点评、美团、抖音、小红书、高德、携程、星级、评分、评价、榜单、推荐、优惠、团购、代金券、折扣、性价比、服务、体验、功能、界面、下单、支付、客服、售后

6. 家电

节能、省电、静音、智能、变频、容量、功率、净化、除菌、制冷、制热、温控、保鲜、烘干、洗涤

7. 食品饮料

口感、味道、香味、甜度、健康、营养、蛋白质、低糖、无糖、低脂、零添加、有机、包装、保质期、品牌、网红、爆款、饮料、奶茶、咖啡、零食、坚果

8. 服装鞋帽

款式、版型、剪裁、设计、风格、面料、材质、棉、麻、丝、舒适、透气、保暖、防水、防晒、性价比、质量、做工、尺码、合身、上衣、裤子、外套、运动鞋、配饰

9. 家居家装

风格、设计、布局、空间、采光、通风、材质、实木、收纳、储物、多功能、耐用、环保、甲醛、沙发、床、床垫、衣柜、灯具、窗帘、地板、瓷砖、厨房、卧室

10. 金融保险

收益、利率、回报率、分红、本金、保额、保费、风险、稳健、理财、基金、股票、保险、重疾险、医疗险、服务、专业、便捷、顾问、规划、银行、支付宝

11. 教育培训

课程、内容、体系、师资、老师、讲师、专业、系统、实用、互动、答疑、辅导、提升、进步、掌握、考证、通过、上岸、就业、服务、试听课、线上、线下、直播

12. 旅游酒店

景点、景区、风景、酒店、民宿、位置、交通、设施、卫生、服务、早餐、体验、放松、度假、亲子、性价比、星级、评分、预订、行程、攻略、自由行

13. 医疗健康

症状、病情、诊断、治疗、康复、医生、专家、医院、诊所、服务、挂号、预约、效果、疗效、安全、副作用、费用、价格、医保、报销、药品、器械

14. 游戏娱乐

手游、端游、网游、RPG、MOBA、FPS、画质、画面、流畅、卡顿、延迟、玩法、操作、剧情、角色、社交、组队、竞技、排位、氪金、充值、抽卡、皮肤、活动

15. 电商零售

淘宝、天猫、京东、拼多多、抖音、商品、SKU、规格、正品、价格、折扣、优惠、满减、券、秒杀、预售、客服、售后、物流、快递、评价、好评、会员、积分

使用示例

基础质检

"质检这份文件"
"质检这份文件，题号B1/C8/D1-1/D1-2"

调整字数阈值

"质检这份文件，字数阈值3字"
"质检这份文件，字数阈值7字"

指定行业

"质检这份文件，手机行业"
"质检这份文件，汽车行业，题号A4/B6"

组合指令

"质检这份文件，手机行业，字数阈值5字，题号B1/C8/D1-1/D1-2"

更新日志

V2.1 (2026-04-08)

新增大众缩写白名单：JD/TB/PDD/WX/ZFB/DD/MT等50+常用缩写
新增纯数字答案检测：智能识别价格/时间类题目，避免误判
新增态度矛盾检测：识别题目与答案情绪不一致的情况（🟡黄色标记）
新增书面语密度检测：检测官方用语密度，识别疑似AI答案
优化中英混杂检测：支持不区分大小写的白名单匹配
扩充行业关键词库：从6个扩展到15个行业
新增7种颜色标记：深红、红、黄、深紫、蓝、浅紫、橙

V1 (2026-03-30)

基础乱码/无逻辑检测
无效答案检测（字数阈值）
AI生成内容检测
重复答案检测
横向一致性检测
自动文件识别
智能子题号识别

survey-open-ended-audit

问卷开放题质检专家 V2.1

功能概述

触发条件

处理流程

颜色标记体系（7种颜色）

处理逻辑

检测规则详解

Rule 1: 乱码/无逻辑检测（优先级1 - 🟤 深红色）

1.1 Unicode乱码检测

1.2 键盘乱敲检测

1.3 连续重复标点

1.4 中英混杂乱码检测（V2.1优化）

1.5 占位符检测

Rule 2: 纯数字答案检测（优先级1 - 🟤 深红色，V2.1新增）

检测逻辑

示例

Rule 3: 无效答案检测（优先级2 - 🔴 红色）

3.1 字数检测（灵活阈值）

3.2 无效短语检测

3.3 无意义词库

Rule 4: 题目-答案态度矛盾检测（优先级3 - 🟡 黄色，V2.1新增）

检测逻辑

示例

Rule 5: AI生成内容检测（优先级4/6 - 🟣深紫色/💜浅紫色）

5.1 基础设置

5.2 结构特征

5.3 AI短语库

5.4 书面语/官方用语密度检测（V2.1新增）

Rule 6: 重复答案检测（优先级7 - 🟠 橙色）

Rule 7: 横向一致性检测（优先级5 - 🔵 蓝色）

行业关键词库（15个行业）

1. 手机数码

2. 汽车

3. 美妆护肤

4. 奶粉母婴

5. 生活服务

6. 家电

7. 食品饮料

8. 服装鞋帽

9. 家居家装

10. 金融保险

11. 教育培训

12. 旅游酒店

13. 医疗健康

14. 游戏娱乐

15. 电商零售

使用示例

基础质检

调整字数阈值

指定行业

组合指令

更新日志

V2.1 (2026-04-08)

V1 (2026-03-30)