sentiment-training
SKILL.md
舆情培训材料生成技能 V2.0
技能说明
本技能用于自动化生成内容安全审核培训材料,专门针对低素质审核员(月薪 2000、无社保、倒班制、考试压力大)设计,重点挖掘隐蔽性风险点,避免简单直观的内容重复培训。
核心功能 V2.0
1. 智能去重
- 自动检测与历史期数重复的舆情
- 完全相同的舆情不再重复出现
- 支持加载多期历史数据进行比对
2. 隐蔽风险识别(重点)
针对低素质审核员设计,重点关注:
- 影射性言论 - 表面正常,实则影射攻击
- 变相攻击 - 借 A 说 B,间接攻击
- 借题发挥 - 借社会热点攻击制度
- 语境依赖型违规 - 需要结合上下文判断
- 灰色地带内容 - 容易误判的边界内容
不关注的内容:
- ❌ 直接辱骂领导人(太明显,不用培训)
- ❌ 明显色情暴力(太明显,不用培训)
- ❌ 显而易见的谣言(太明显,不用培训)
3. 可视化增强
- 使用表格展示统计数据
- 颜色区分风险等级(P0 红、P1 橙红、P2 橙、P3 灰)
- 图标标识(🔥 重点、⚠️ 风险、📋 法规、🛡️ 措施)
- 卡片式布局,减少文字堆积
- 支持插入图片(舆情截图、数据图表)
4. 审核员友好设计
每条舆情包含:
- 内容概述 - 简明扼要
- 隐蔽风险点 - 重点标注,红色高亮
- 法规依据 - 具体到条款
- 查删拦截要求 - 可执行的操作指令
- 易错提示 - 常见错误,橙色提醒
5. 多渠道监控
国际媒体(6个):
- 联合早报海外版
- RFI 法国国际广播电台
- BBC中文(X平台)
- 华尔街日报中文网(X平台)
- 纽约时报中文网(X平台)
- 今日俄罗斯RT(微博)
国内媒体(6个):
- 中国新闻周刊(微博)
- 澎湃新闻(微博)
- 凤凰网(微博)
- 财经网(微博)
- 央视新闻(微博)
- 光明日报(微博)
平台热搜(2个):
- 百度热搜
- 微博热搜
官方媒体(1个):
- 新华网
自媒体监控(1个):
- 抖音自媒体(支持链接列表)
法规条款
《互联网信息服务管理办法》第十五条
互联网信息服务提供者不得制作、复制、发布、传播含有下列内容的信息: (一) 反对宪法所确定的基本原则的; (二) 危害国家安全,泄露国家秘密,颠覆国家政权,破坏国家统一的; (三) 损害国家荣誉和利益的; (四) 煽动民族仇恨、民族歧视,破坏民族团结的; (五) 破坏国家宗教政策,宣扬邪教和封建迷信的; (六) 散布谣言,扰乱社会秩序,破坏社会稳定的; (七) 散布淫秽、色情、赌博、暴力、凶杀、恐怖或者教唆犯罪的; (八) 侮辱或者诽谤他人,侵害他人合法权益的; (九) 含有法律、行政法规禁止的其他内容的。
《网络安全法》第十二条
任何个人和组织使用网络应当遵守宪法法律,遵守公共秩序,尊重社会公德,不得危害网络安全,不得利用网络从事危害国家安全、荣誉和利益,煽动颠覆国家政权、推翻社会主义制度,煽动分裂国家、破坏国家统一,宣扬恐怖主义、极端主义,宣扬民族仇恨、民族歧视,传播暴力、淫秽色情信息,编造、传播虚假信息扰乱经济秩序和社会秩序,以及侵害他人名誉、隐私、知识产权和其他合法权益等活动。
使用方法
1. 准备数据文件
创建 JSON 数据文件,格式如下:
{
"title": "3月第四周重点舆情讲解(三)",
"period": "2026-3-26",
"issue_no": "901",
"time_range": "3月25日17:00-3月26日17:00",
"total_count": 8,
"p0_count": 0,
"p1_count": 3,
"p2_count": 3,
"p3_count": 2,
"key_events": ["事件1", "事件2"],
"douyin_accounts": [
"https://v.douyin.com/xxx/",
"https://v.douyin.com/yyy/"
],
"categories": [
{
"name": "一、涉政敏感",
"risk_levels": "P1",
"hotspots": [
{
"no": "1",
"level": "P1",
"title": "舆情标题",
"source": "信息来源",
"content": ["内容段落1", "内容段落2"],
"hidden_risks": [
"隐蔽风险点1",
"隐蔽风险点2"
],
"legal_basis": [
"《互联网信息服务管理办法》第十五条(四)",
"《网络安全法》第十二条"
],
"control": [
"查删拦截要求1",
"查删拦截要求2"
],
"common_mistakes": [
"易错提示1",
"易错提示2"
]
}
]
}
],
"control_summary": [
"封控要求1",
"封控要求2"
]
}
2. 生成培训材料
基础生成:
cd ~/.openclaw/workspace/skills/sentiment-training
python3 generate_training_doc.py --data data/你的数据文件.json
使用增强版生成器(推荐):
python3 -c "
import sys
sys.path.insert(0, '.')
from generator.enhanced_generator import EnhancedTrainingDocGenerator
import json
with open('data/你的数据文件.json', 'r', encoding='utf-8') as f:
data = json.load(f)
generator = EnhancedTrainingDocGenerator()
# 可选:加载历史数据去重
# generator.load_previous_issues([prev_data1, prev_data2])
generator.generate(data, 'output/培训材料.docx')
"
3. 发送到 POPO
python3 send_to_popo.py output/培训材料.docx 接收人邮箱@corp.netease.com
数据文件模板
第 901 期示例数据
参考文件:data/第901期_最终版.json
包含完整的数据结构示例,可直接复制修改。
关键字段说明
舆情条目字段
| 字段 | 类型 | 说明 | 必填 |
|---|---|---|---|
| no | string | 序号 | 是 |
| level | string | 风险等级(P0/P1/P2/P3) | 是 |
| title | string | 舆情标题 | 是 |
| source | string | 信息来源 | 否 |
| content | array | 内容概述(字符串数组) | 是 |
| hidden_risks | array | 隐蔽风险点(重点) | 是 |
| legal_basis | array | 法规依据 | 是 |
| control | array | 查删拦截要求 | 是 |
| common_mistakes | array | 易错提示 | 是 |
隐蔽风险点编写指南
好的示例:
- ❌ 不好:"不要发布攻击领导人的内容"(太明显)
- ✅ 好:"【影射风险】讨论中可能借台湾司法案例影射大陆司法制度,如'台湾都能判17年,大陆呢'等对比性言论"
编写要点:
- 说明风险类型(影射、变相、借题发挥等)
- 给出具体示例话术
- 说明为什么难以识别
- 结合审核员画像(低素质、低主动性)
易错提示编写指南
好的示例:
- "误认为单纯讨论台湾新闻无风险,忽视影射性言论"
- "将'家长吐槽'误认为正常讨论,忽视其中的煽动性"
编写要点:
- 指出审核员常犯的错误
- 说明错误原因(经验不足、敏感度不够等)
- 给出正确做法
文件结构
sentiment-training/
├── config/
│ └── sources.json # 信息源配置
├── crawler/
│ ├── __init__.py
│ └── base.py # 爬虫基类
├── analyzer/
│ ├── __init__.py
│ ├── classifier.py # 内容分类器
│ ├── law_matcher.py # 法规匹配器
│ └── risk_assessor.py # 风险评估
├── generator/
│ ├── __init__.py
│ ├── standard_generator.py # 标准版生成器
│ └── enhanced_generator.py # 增强版生成器(V2.0)
├── data/
│ ├── raw/ # 原始抓取数据
│ ├── archive/ # 历史归档
│ └── 第901期_最终版.json # 示例数据
├── output/ # 输出文档
├── templates/ # 文档模板
├── requirements.txt
├── generate_training_doc.py # 文档生成主程序
├── send_to_popo.py # POPO发送脚本
└── SKILL.md # 本说明文件
更新记录
V2.0(2026-03-27)
- ✨ 新增智能去重功能,避免重复舆情
- ✨ 新增隐蔽风险识别,针对低素质审核员优化
- ✨ 新增可视化增强,表格+图标+颜色
- ✨ 新增审核员友好设计,易错提示+实操指导
- ✨ 新增抖音自媒体监控支持
- 🔧 优化文档布局,减少文字堆积
- 🔧 优化风险等级颜色标识
V1.0(2026-03-26)
- 🎉 初始版本,支持多渠道爬虫和 POPO 文档生成
- 🎉 支持法规条款自动关联
- 🎉 支持封控要求生成
使用建议
针对审核主管
- 数据准备:提前收集舆情信息,填写 JSON 数据文件
- 去重检查:加载上一期数据,确保无重复
- 风险挖掘:重点关注隐蔽性风险点,避免 obvious 内容
- 定期更新:每周/每日更新,保持时效性
针对审核员
- 重点阅读:隐蔽风险点(红色高亮部分)
- 牢记易错:常见错误提示,避免踩坑
- 对照执行:查删拦截要求,按步骤操作
- 法规依据:理解为什么这样做
注意事项
- 时效性:确保舆情在指定时间范围内
- 准确性:核实舆情事实,避免虚假信息
- 完整性:每条舆情必须包含所有必填字段
- 实用性:隐蔽风险点要具体、可操作
技术支持
如有问题,请联系开发团队。