舆情培训材料生成技能 V2.0

技能说明

本技能用于自动化生成内容安全审核培训材料，专门针对低素质审核员（月薪 2000、无社保、倒班制、考试压力大）设计，重点挖掘隐蔽性风险点，避免简单直观的内容重复培训。

核心功能 V2.0

1. 智能去重

自动检测与历史期数重复的舆情
完全相同的舆情不再重复出现
支持加载多期历史数据进行比对

2. 隐蔽风险识别（重点）

针对低素质审核员设计，重点关注：

影射性言论 - 表面正常，实则影射攻击
变相攻击 - 借 A 说 B，间接攻击
借题发挥 - 借社会热点攻击制度
语境依赖型违规 - 需要结合上下文判断
灰色地带内容 - 容易误判的边界内容

不关注的内容：

❌ 直接辱骂领导人（太明显，不用培训）
❌ 明显色情暴力（太明显，不用培训）
❌ 显而易见的谣言（太明显，不用培训）

3. 可视化增强

使用表格展示统计数据
颜色区分风险等级（P0 红、P1 橙红、P2 橙、P3 灰）
图标标识（🔥 重点、⚠️ 风险、📋 法规、🛡️ 措施）
卡片式布局，减少文字堆积
支持插入图片（舆情截图、数据图表）

4. 审核员友好设计

每条舆情包含：

内容概述 - 简明扼要
隐蔽风险点 - 重点标注，红色高亮
法规依据 - 具体到条款
查删拦截要求 - 可执行的操作指令
易错提示 - 常见错误，橙色提醒

5. 多渠道监控

国际媒体（6个）：

联合早报海外版
RFI 法国国际广播电台
BBC中文（X平台）
华尔街日报中文网（X平台）
纽约时报中文网（X平台）
今日俄罗斯RT（微博）

国内媒体（6个）：

中国新闻周刊（微博）
澎湃新闻（微博）
凤凰网（微博）
财经网（微博）
央视新闻（微博）
光明日报（微博）

平台热搜（2个）：

百度热搜
微博热搜

官方媒体（1个）：

新华网

自媒体监控（1个）：

抖音自媒体（支持链接列表）

法规条款

《互联网信息服务管理办法》第十五条

互联网信息服务提供者不得制作、复制、发布、传播含有下列内容的信息： (一) 反对宪法所确定的基本原则的； (二) 危害国家安全，泄露国家秘密，颠覆国家政权，破坏国家统一的； (三) 损害国家荣誉和利益的； (四) 煽动民族仇恨、民族歧视，破坏民族团结的； (五) 破坏国家宗教政策，宣扬邪教和封建迷信的； (六) 散布谣言，扰乱社会秩序，破坏社会稳定的； (七) 散布淫秽、色情、赌博、暴力、凶杀、恐怖或者教唆犯罪的； (八) 侮辱或者诽谤他人，侵害他人合法权益的； (九) 含有法律、行政法规禁止的其他内容的。

《网络安全法》第十二条

任何个人和组织使用网络应当遵守宪法法律，遵守公共秩序，尊重社会公德，不得危害网络安全，不得利用网络从事危害国家安全、荣誉和利益，煽动颠覆国家政权、推翻社会主义制度，煽动分裂国家、破坏国家统一，宣扬恐怖主义、极端主义，宣扬民族仇恨、民族歧视，传播暴力、淫秽色情信息，编造、传播虚假信息扰乱经济秩序和社会秩序，以及侵害他人名誉、隐私、知识产权和其他合法权益等活动。

使用方法

1. 准备数据文件

创建 JSON 数据文件，格式如下：

{
  "title": "3月第四周重点舆情讲解（三）",
  "period": "2026-3-26",
  "issue_no": "901",
  "time_range": "3月25日17:00-3月26日17:00",
  "total_count": 8,
  "p0_count": 0,
  "p1_count": 3,
  "p2_count": 3,
  "p3_count": 2,
  "key_events": ["事件1", "事件2"],
  "douyin_accounts": [
    "https://v.douyin.com/xxx/",
    "https://v.douyin.com/yyy/"
  ],
  "categories": [
    {
      "name": "一、涉政敏感",
      "risk_levels": "P1",
      "hotspots": [
        {
          "no": "1",
          "level": "P1",
          "title": "舆情标题",
          "source": "信息来源",
          "content": ["内容段落1", "内容段落2"],
          "hidden_risks": [
            "隐蔽风险点1",
            "隐蔽风险点2"
          ],
          "legal_basis": [
            "《互联网信息服务管理办法》第十五条（四）",
            "《网络安全法》第十二条"
          ],
          "control": [
            "查删拦截要求1",
            "查删拦截要求2"
          ],
          "common_mistakes": [
            "易错提示1",
            "易错提示2"
          ]
        }
      ]
    }
  ],
  "control_summary": [
    "封控要求1",
    "封控要求2"
  ]
}

2. 生成培训材料

基础生成：

cd ~/.openclaw/workspace/skills/sentiment-training
python3 generate_training_doc.py --data data/你的数据文件.json

使用增强版生成器（推荐）：

python3 -c "
import sys
sys.path.insert(0, '.')
from generator.enhanced_generator import EnhancedTrainingDocGenerator
import json

with open('data/你的数据文件.json', 'r', encoding='utf-8') as f:
    data = json.load(f)

generator = EnhancedTrainingDocGenerator()

# 可选：加载历史数据去重
# generator.load_previous_issues([prev_data1, prev_data2])

generator.generate(data, 'output/培训材料.docx')
"

3. 发送到 POPO

python3 send_to_popo.py output/培训材料.docx 接收人邮箱@corp.netease.com

数据文件模板

第 901 期示例数据

参考文件：data/第901期_最终版.json

包含完整的数据结构示例，可直接复制修改。

关键字段说明

舆情条目字段

字段	类型	说明	必填
no	string	序号	是
level	string	风险等级（P0/P1/P2/P3）	是
title	string	舆情标题	是
source	string	信息来源	否
content	array	内容概述（字符串数组）	是
hidden_risks	array	隐蔽风险点（重点）	是
legal_basis	array	法规依据	是
control	array	查删拦截要求	是
common_mistakes	array	易错提示	是

隐蔽风险点编写指南

好的示例：

❌ 不好："不要发布攻击领导人的内容"（太明显）
✅ 好："【影射风险】讨论中可能借台湾司法案例影射大陆司法制度，如'台湾都能判17年，大陆呢'等对比性言论"

编写要点：

说明风险类型（影射、变相、借题发挥等）
给出具体示例话术
说明为什么难以识别
结合审核员画像（低素质、低主动性）

易错提示编写指南

好的示例：

"误认为单纯讨论台湾新闻无风险，忽视影射性言论"
"将'家长吐槽'误认为正常讨论，忽视其中的煽动性"

编写要点：

指出审核员常犯的错误
说明错误原因（经验不足、敏感度不够等）
给出正确做法

文件结构

sentiment-training/
├── config/
│   └── sources.json              # 信息源配置
├── crawler/
│   ├── __init__.py
│   └── base.py                   # 爬虫基类
├── analyzer/
│   ├── __init__.py
│   ├── classifier.py             # 内容分类器
│   ├── law_matcher.py            # 法规匹配器
│   └── risk_assessor.py          # 风险评估
├── generator/
│   ├── __init__.py
│   ├── standard_generator.py     # 标准版生成器
│   └── enhanced_generator.py     # 增强版生成器（V2.0）
├── data/
│   ├── raw/                      # 原始抓取数据
│   ├── archive/                  # 历史归档
│   └── 第901期_最终版.json       # 示例数据
├── output/                       # 输出文档
├── templates/                    # 文档模板
├── requirements.txt
├── generate_training_doc.py      # 文档生成主程序
├── send_to_popo.py               # POPO发送脚本
└── SKILL.md                      # 本说明文件

更新记录

V2.0（2026-03-27）

✨ 新增智能去重功能，避免重复舆情
✨ 新增隐蔽风险识别，针对低素质审核员优化
✨ 新增可视化增强，表格+图标+颜色
✨ 新增审核员友好设计，易错提示+实操指导
✨ 新增抖音自媒体监控支持
🔧 优化文档布局，减少文字堆积
🔧 优化风险等级颜色标识

V1.0（2026-03-26）

🎉 初始版本，支持多渠道爬虫和 POPO 文档生成
🎉 支持法规条款自动关联
🎉 支持封控要求生成

使用建议

针对审核主管

数据准备：提前收集舆情信息，填写 JSON 数据文件
去重检查：加载上一期数据，确保无重复
风险挖掘：重点关注隐蔽性风险点，避免 obvious 内容
定期更新：每周/每日更新，保持时效性

针对审核员

重点阅读：隐蔽风险点（红色高亮部分）
牢记易错：常见错误提示，避免踩坑
对照执行：查删拦截要求，按步骤操作
法规依据：理解为什么这样做

注意事项

时效性：确保舆情在指定时间范围内
准确性：核实舆情事实，避免虚假信息
完整性：每条舆情必须包含所有必填字段
实用性：隐蔽风险点要具体、可操作

技术支持

如有问题，请联系开发团队。