skills/skills.netease.im/survey-open-ended-audit

survey-open-ended-audit

SKILL.md

问卷开放题质检专家 V2.1

更新日期:2026-04-08 版本:V2.1 核心更新:大众缩写白名单、纯数字答案检测、态度矛盾检测、书面语密度检测

功能概述

自动检测问卷开放题中的质量问题,支持:

  1. 自动文件识别 - 自动检测下载目录最新Excel文件
  2. 智能子题号识别 - 自动识别 A4-1/A4-2/A4-3 等所有子问题
  3. 7种颜色标记 - 多规则触发时优先标记程度更重的颜色
  4. 自动发送结果 - 质检完成后直接通过POPO发送结果文件
  5. 15个行业关键词库 - 手机、汽车、美妆、食品、教育、医疗等
  6. 灵活字数阈值 - 每次质检可自定义字数阈值

触发条件

当用户提到以下关键词时触发:

  • "开放题质检"
  • "问卷清洗"
  • "检查开放题"
  • "审核问卷答案"
  • "质检问卷"
  • "开放题审核"

处理流程

用户发送文件 + 开放题质检指令
【步骤1】自动识别文件
  - 检查 ~/.openclaw/downloads/popo-files/ 最新文件
  - 确认文件格式为 .xlsx/.xls
【步骤2】解析质检要求
  - 识别是否指定题号(如 A4/A6/B4...)
  - 识别调研主题(手机/汽车/美妆等)
  - 识别字数阈值(默认5字,可调整)
  - 识别重点关注项(乱答题/乱码/AI/态度矛盾等)
【步骤3】执行质检(按优先级标记)
  优先级1: 🟤 深红色 - 乱码/无逻辑/纯数字(最严重)
  优先级2: 🔴 红色 - 无效答案(字数≤阈值)
  优先级3: 🟡 黄色 - 态度矛盾(新增)
  优先级4: 🟣 深紫色 - 高度疑似AI(≥3特征)
  优先级5: 🔵 蓝色 - 横向一致
  优先级6: 💜 浅紫色 - 疑似AI(≥1特征)
  优先级7: 🟠 橙色 - 重复答案
【步骤4】生成质检报告
  - 保存带高亮标记的Excel文件
  - 生成统计摘要
【步骤5】自动发送结果
  - 通过POPO发送质检结果文件
  - 附带质检统计报告

颜色标记体系(7种颜色)

优先级 颜色 标记 规则类型 恶劣程度
1 深红色 🟤 乱码/无逻辑/纯数字 最严重
2 红色 🔴 无效答案(字数≤阈值) 严重
3 黄色 🟡 态度矛盾(新增) 严重
4 深紫色 🟣 高度疑似AI(≥3特征) 较重
5 蓝色 🔵 横向一致 中等
6 浅紫色 💜 疑似AI(≥1特征) 较轻
7 橙色 🟠 重复答案 轻微

处理逻辑

检测答案时:
  IF 乱码/无逻辑/纯数字 → 标记 🟤 深红色(最高优先级)
  ELSE IF 无效答案 → 标记 🔴 红色
  ELSE IF 态度矛盾 → 标记 🟡 黄色
  ELSE IF 高度疑似AI → 标记 🟣 深紫色
  ELSE IF 横向一致 → 标记 🔵 蓝色
  ELSE IF 疑似AI → 标记 💜 浅紫色
  ELSE IF 重复答案 → 标记 🟠 橙色

检测规则详解

Rule 1: 乱码/无逻辑检测(优先级1 - 🟤 深红色)

1.1 Unicode乱码检测

  • 触发条件:包含"锟斤拷"、"烫烫烫"、"屯屯屯"、"�"等乱码字符
  • 标记:🟤 深红色
  • 说明:【乱码】包含乱码字符

1.2 键盘乱敲检测

  • 触发条件:纯键盘序列(asdfghjkl、qwertyuiop、zxcvbnm)
  • 标记:🟤 深红色
  • 说明:【乱敲】疑似键盘乱敲

1.3 连续重复标点

  • 触发条件:连续5个以上相同标点(如"!!!!!")
  • 标记:🟤 深红色
  • 说明:【混乱】标点滥用

1.4 中英混杂乱码检测(V2.1优化)

  • 检测逻辑
    1. 先替换白名单中的英文术语(不区分大小写)
    2. 检查剩余文本中是否还有中英混杂
    3. 过滤掉常见短单词(ok、or、to、go等)
  • 触发条件:中文+英文(2字母以上)+中文
  • 标记:🟤 深红色
  • 说明:【乱码】中英混杂(可疑词:xxx)

白名单术语(不区分大小写)

  • 手机/数码:iPhone, Pro, Max, Air, Mate, eSIM, 5G, WiFi, OLED, CPU, GPU, A19, 骁龙等
  • 汽车:BBA, Tesla, BYD, NIO, L2/L3, NOA, HUD, 激光雷达, CLTC等
  • 科技通用:AI, GPT, APP, CPU, GPU, RAM, ROM, VR, AR等
  • 大众缩写(V2.1新增)
    • 电商:JD/jd(京东)、TB/tb(淘宝)、PDD/pdd(拼多多)、AMZ/amz(亚马逊)
    • 社交:WX/wx(微信)、QQ/qq、WB/wb(微博)、B站/b站、DY/dy(抖音)
    • 支付:ZFB/zfb(支付宝)
    • 出行:DD/dd(滴滴)、高德/GD
    • 外卖:MT/mt(美团)、ELM/elm(饿了么)
    • 其他:VIP/vip、APP/app、OK/ok、BGM/bgm、VLOG/vlog、KOL/kol、UP主/up主等

1.5 占位符检测

  • 触发条件:包含XXX、xxx、待定、TBD、[姓名]、[产品名]、[时间]
  • 标记:🟤 深红色
  • 说明:【空洞】内容空洞

Rule 2: 纯数字答案检测(优先级1 - 🟤 深红色,V2.1新增)

检测逻辑

  • 触发条件:答案为纯数字格式(如"123"、"99.9"、"100元"、"¥50"、"12:30")
  • 智能跳过:如果题目涉及以下关键词,则不标记为乱码
    • 价格类:价格、多少钱、费用、成本、预算、落地价
    • 时间类:时间、时长、多久、日期、周期
    • 优惠类:满减、折扣、优惠、券、红包、返利
    • 数量类:数量、几个、多少、额度、金额
    • 评分类:评分、打分、星级、分数、排名
    • 其他:年龄、身高、体重、距离、续航、比例

示例

  • 题目"您购买的价格是?" + 答案"5999" → ✅ 正常(题目涉及价格)
  • 题目"您满意的原因是什么?" + 答案"100" → 🟤 乱码(纯数字且无意义)

Rule 3: 无效答案检测(优先级2 - 🔴 红色)

3.1 字数检测(灵活阈值)

  • 默认阈值:≤5字为无效(可调整)
  • 标记:🔴 红色
  • 说明:【无效】字数不足(仅N字)
  • 调整方式:质检时指定"字数阈值X字"

3.2 无效短语检测

  • 触发短语:"追求卓越的"、"不断创新的"、"与时俱进的"
  • 标记:🔴 红色
  • 说明:【无效】命中无效短语「xxx」

3.3 无意义词库

  • 触发词汇:无、没有、不知道、不清楚、略、呵呵、哈哈、嗯、哦、好、ok、none、n/a等
  • 标记:🔴 红色
  • 说明:【无效】无意义词

Rule 4: 题目-答案态度矛盾检测(优先级3 - 🟡 黄色,V2.1新增)

检测逻辑

  1. 识别题目类型

    • 正面题目:含"满意"、"喜欢"、"优点"、"优势"、"推荐"、"购买原因"等
    • 负面题目:含"不满意"、"不喜欢"、"缺点"、"不足"、"吐槽"、"流失"等
  2. 识别答案情绪

    • 正面词汇:满意、喜欢、棒、好、优秀、推荐、值得、划算、舒服、流畅、惊喜、开心、信任等
    • 负面词汇:讨厌、差、烂、糟糕、失望、后悔、不满、难受、问题、缺陷、卡顿、贵、差评、不足等
  3. 矛盾判断

    • 正面题目 + 负面答案(无正面词)→ 🟡 黄色
    • 负面题目 + 正面答案(无负面词)→ 🟡 黄色

示例

  • 题目"满意点有哪些?" + 答案"续航没有想象的那么差" → 🟡 黄色(含负面词"差")
  • 题目"不满意的地方?" + 答案"都很满意,没有不满意的" → 🟡 黄色(负面题目+纯正面答案)
  • 题目"满意点有哪些?" + 答案"单扬声器有点缺憾,其他完美" → 不标记(混合情绪)

Rule 5: AI生成内容检测(优先级4/6 - 🟣深紫色/💜浅紫色)

5.1 基础设置

  • 字数门槛:≥10字才检测AI特征
  • 高度疑似AI:≥3个特征 → 🟣 深紫色
  • 疑似AI:≥1个特征 → 💜 浅紫色

5.2 结构特征

  • 分点列举格式(1. xxx / ① xxx / 一、xxx)
  • 特殊符号开头(- • ▪ , ·)

5.3 AI短语库

  • 结构词:综上所述、总而言之、由此可见、值得一提的是、不容忽视
  • 维度词:从多个维度、全方位、多角度、深层次、全面考虑
  • 连接词:此外、不仅如此、更重要的是、具体来说、总的来说
  • 代词:该产品、该手机、此产品、此品牌
  • 营销词:品质保证、值得信赖、首选品牌、深受喜爱、广受好评
  • 表现词:卓越性能、极致体验、完美契合、显著优势、突出表现

5.4 书面语/官方用语密度检测(V2.1新增)

  • 触发条件:书面语占比≥15% 且 ≥3个书面语词汇
  • 标记:💜 浅紫色
  • 说明:【疑似AI】书面语密度高(N个词,占比X%)

书面语词库

  • 结构连接词:首先、其次、再次、第一、第二、一方面、另一方面、与此同时
  • 强调词:值得注意的是、需要指出的是、不可否认、毫无疑问
  • 评价词:具有一定的、表现出、体现出、得到了、取得了
  • 程度词:较为、相当、极其、显著地、明显地
  • 转折/因果:然而、因此、因而、从而、由于、因为
  • 总结词:总之、综上所述、由此可见、一言以蔽之
  • 指代词:其、之、所、该、此、上述、前者、后者
  • 动词/名词:进行、予以、加以、情况、问题、方面、领域、机制、体系
  • 形容词:良好的、优秀的、完善的、全面的、重要的、关键的

Rule 6: 重复答案检测(优先级7 - 🟠 橙色)

  • 触发条件:同一开放题列中,相同答案出现≥3次
  • 排除条件:字数≤阈值的不计入
  • 标记:🟠 橙色
  • 说明:【重复】同题目下重复回答N次

Rule 7: 横向一致性检测(优先级5 - 🔵 蓝色)

  • 触发条件:同一行内,多个开放题列的答案完全相同
  • 排除条件:字数≤阈值的不计入
  • 标记:🔵 蓝色
  • 说明:【横向一致】同一行内N个题目答案相同

行业关键词库(15个行业)

1. 手机数码

屏幕、性能、续航、散热、处理器、像素、分辨率、电池、充电、系统、轻薄、手感、外观、设计、颜值、芯片、摄像头、拍照、鸿蒙、iOS、安卓、快充、流畅、卡顿、性价比、品牌、口碑、游戏、办公、售后

2. 汽车

动力、加速、操控、舒适、空间、内饰、外观、续航、里程、电耗、油耗、智能、智驾、辅助驾驶、智能座舱、车机、导航、HUD、雷达、特斯拉、比亚迪、蔚来、小鹏、理想、性价比、家用、通勤、保养

3. 美妆护肤

保湿、补水、美白、抗衰、抗氧化、精华、成分、肌肤、滋润、修复、紧致、提亮、清爽、敏感肌、痘痘、毛孔、细纹、防晒、隔离、遮瑕、持妆、胶原蛋白、玻尿酸、烟酰胺

4. 奶粉母婴

蛋白、乳铁蛋白、益生菌、DHA、ARA、OPO、核苷酸、牛乳、配方、营养成分、吸收、消化、免疫力、肠道、脑部发育、骨骼、钙、铁、锌、维生素、有机、奶源、段数、冲泡

5. 生活服务

点评、美团、抖音、小红书、高德、携程、星级、评分、评价、榜单、推荐、优惠、团购、代金券、折扣、性价比、服务、体验、功能、界面、下单、支付、客服、售后

6. 家电

节能、省电、静音、智能、变频、容量、功率、净化、除菌、制冷、制热、温控、保鲜、烘干、洗涤

7. 食品饮料

口感、味道、香味、甜度、健康、营养、蛋白质、低糖、无糖、低脂、零添加、有机、包装、保质期、品牌、网红、爆款、饮料、奶茶、咖啡、零食、坚果

8. 服装鞋帽

款式、版型、剪裁、设计、风格、面料、材质、棉、麻、丝、舒适、透气、保暖、防水、防晒、性价比、质量、做工、尺码、合身、上衣、裤子、外套、运动鞋、配饰

9. 家居家装

风格、设计、布局、空间、采光、通风、材质、实木、收纳、储物、多功能、耐用、环保、甲醛、沙发、床、床垫、衣柜、灯具、窗帘、地板、瓷砖、厨房、卧室

10. 金融保险

收益、利率、回报率、分红、本金、保额、保费、风险、稳健、理财、基金、股票、保险、重疾险、医疗险、服务、专业、便捷、顾问、规划、银行、支付宝

11. 教育培训

课程、内容、体系、师资、老师、讲师、专业、系统、实用、互动、答疑、辅导、提升、进步、掌握、考证、通过、上岸、就业、服务、试听课、线上、线下、直播

12. 旅游酒店

景点、景区、风景、酒店、民宿、位置、交通、设施、卫生、服务、早餐、体验、放松、度假、亲子、性价比、星级、评分、预订、行程、攻略、自由行

13. 医疗健康

症状、病情、诊断、治疗、康复、医生、专家、医院、诊所、服务、挂号、预约、效果、疗效、安全、副作用、费用、价格、医保、报销、药品、器械

14. 游戏娱乐

手游、端游、网游、RPG、MOBA、FPS、画质、画面、流畅、卡顿、延迟、玩法、操作、剧情、角色、社交、组队、竞技、排位、氪金、充值、抽卡、皮肤、活动

15. 电商零售

淘宝、天猫、京东、拼多多、抖音、商品、SKU、规格、正品、价格、折扣、优惠、满减、券、秒杀、预售、客服、售后、物流、快递、评价、好评、会员、积分


使用示例

基础质检

"质检这份文件"
"质检这份文件,题号B1/C8/D1-1/D1-2"

调整字数阈值

"质检这份文件,字数阈值3字"
"质检这份文件,字数阈值7字"

指定行业

"质检这份文件,手机行业"
"质检这份文件,汽车行业,题号A4/B6"

组合指令

"质检这份文件,手机行业,字数阈值5字,题号B1/C8/D1-1/D1-2"

更新日志

V2.1 (2026-04-08)

  1. 新增大众缩写白名单:JD/TB/PDD/WX/ZFB/DD/MT等50+常用缩写
  2. 新增纯数字答案检测:智能识别价格/时间类题目,避免误判
  3. 新增态度矛盾检测:识别题目与答案情绪不一致的情况(🟡黄色标记)
  4. 新增书面语密度检测:检测官方用语密度,识别疑似AI答案
  5. 优化中英混杂检测:支持不区分大小写的白名单匹配
  6. 扩充行业关键词库:从6个扩展到15个行业
  7. 新增7种颜色标记:深红、红、黄、深紫、蓝、浅紫、橙

V1 (2026-03-30)

  1. 基础乱码/无逻辑检测
  2. 无效答案检测(字数阈值)
  3. AI生成内容检测
  4. 重复答案检测
  5. 横向一致性检测
  6. 自动文件识别
  7. 智能子题号识别
Installs
2
First Seen
Apr 8, 2026