skills/skills.netease.im/sentiment-training

sentiment-training

SKILL.md

舆情培训材料生成技能 V2.0

技能说明

本技能用于自动化生成内容安全审核培训材料,专门针对低素质审核员(月薪 2000、无社保、倒班制、考试压力大)设计,重点挖掘隐蔽性风险点,避免简单直观的内容重复培训。

核心功能 V2.0

1. 智能去重

  • 自动检测与历史期数重复的舆情
  • 完全相同的舆情不再重复出现
  • 支持加载多期历史数据进行比对

2. 隐蔽风险识别(重点)

针对低素质审核员设计,重点关注:

  • 影射性言论 - 表面正常,实则影射攻击
  • 变相攻击 - 借 A 说 B,间接攻击
  • 借题发挥 - 借社会热点攻击制度
  • 语境依赖型违规 - 需要结合上下文判断
  • 灰色地带内容 - 容易误判的边界内容

不关注的内容

  • ❌ 直接辱骂领导人(太明显,不用培训)
  • ❌ 明显色情暴力(太明显,不用培训)
  • ❌ 显而易见的谣言(太明显,不用培训)

3. 可视化增强

  • 使用表格展示统计数据
  • 颜色区分风险等级(P0 红、P1 橙红、P2 橙、P3 灰)
  • 图标标识(🔥 重点、⚠️ 风险、📋 法规、🛡️ 措施)
  • 卡片式布局,减少文字堆积
  • 支持插入图片(舆情截图、数据图表)

4. 审核员友好设计

每条舆情包含:

  • 内容概述 - 简明扼要
  • 隐蔽风险点 - 重点标注,红色高亮
  • 法规依据 - 具体到条款
  • 查删拦截要求 - 可执行的操作指令
  • 易错提示 - 常见错误,橙色提醒

5. 多渠道监控

国际媒体(6个)

  • 联合早报海外版
  • RFI 法国国际广播电台
  • BBC中文(X平台)
  • 华尔街日报中文网(X平台)
  • 纽约时报中文网(X平台)
  • 今日俄罗斯RT(微博)

国内媒体(6个)

  • 中国新闻周刊(微博)
  • 澎湃新闻(微博)
  • 凤凰网(微博)
  • 财经网(微博)
  • 央视新闻(微博)
  • 光明日报(微博)

平台热搜(2个)

  • 百度热搜
  • 微博热搜

官方媒体(1个)

  • 新华网

自媒体监控(1个)

  • 抖音自媒体(支持链接列表)

法规条款

《互联网信息服务管理办法》第十五条

互联网信息服务提供者不得制作、复制、发布、传播含有下列内容的信息: (一) 反对宪法所确定的基本原则的; (二) 危害国家安全,泄露国家秘密,颠覆国家政权,破坏国家统一的; (三) 损害国家荣誉和利益的; (四) 煽动民族仇恨、民族歧视,破坏民族团结的; (五) 破坏国家宗教政策,宣扬邪教和封建迷信的; (六) 散布谣言,扰乱社会秩序,破坏社会稳定的; (七) 散布淫秽、色情、赌博、暴力、凶杀、恐怖或者教唆犯罪的; (八) 侮辱或者诽谤他人,侵害他人合法权益的; (九) 含有法律、行政法规禁止的其他内容的。

《网络安全法》第十二条

任何个人和组织使用网络应当遵守宪法法律,遵守公共秩序,尊重社会公德,不得危害网络安全,不得利用网络从事危害国家安全、荣誉和利益,煽动颠覆国家政权、推翻社会主义制度,煽动分裂国家、破坏国家统一,宣扬恐怖主义、极端主义,宣扬民族仇恨、民族歧视,传播暴力、淫秽色情信息,编造、传播虚假信息扰乱经济秩序和社会秩序,以及侵害他人名誉、隐私、知识产权和其他合法权益等活动。

使用方法

1. 准备数据文件

创建 JSON 数据文件,格式如下:

{
  "title": "3月第四周重点舆情讲解(三)",
  "period": "2026-3-26",
  "issue_no": "901",
  "time_range": "3月25日17:00-3月26日17:00",
  "total_count": 8,
  "p0_count": 0,
  "p1_count": 3,
  "p2_count": 3,
  "p3_count": 2,
  "key_events": ["事件1", "事件2"],
  "douyin_accounts": [
    "https://v.douyin.com/xxx/",
    "https://v.douyin.com/yyy/"
  ],
  "categories": [
    {
      "name": "一、涉政敏感",
      "risk_levels": "P1",
      "hotspots": [
        {
          "no": "1",
          "level": "P1",
          "title": "舆情标题",
          "source": "信息来源",
          "content": ["内容段落1", "内容段落2"],
          "hidden_risks": [
            "隐蔽风险点1",
            "隐蔽风险点2"
          ],
          "legal_basis": [
            "《互联网信息服务管理办法》第十五条(四)",
            "《网络安全法》第十二条"
          ],
          "control": [
            "查删拦截要求1",
            "查删拦截要求2"
          ],
          "common_mistakes": [
            "易错提示1",
            "易错提示2"
          ]
        }
      ]
    }
  ],
  "control_summary": [
    "封控要求1",
    "封控要求2"
  ]
}

2. 生成培训材料

基础生成

cd ~/.openclaw/workspace/skills/sentiment-training
python3 generate_training_doc.py --data data/你的数据文件.json

使用增强版生成器(推荐)

python3 -c "
import sys
sys.path.insert(0, '.')
from generator.enhanced_generator import EnhancedTrainingDocGenerator
import json

with open('data/你的数据文件.json', 'r', encoding='utf-8') as f:
    data = json.load(f)

generator = EnhancedTrainingDocGenerator()

# 可选:加载历史数据去重
# generator.load_previous_issues([prev_data1, prev_data2])

generator.generate(data, 'output/培训材料.docx')
"

3. 发送到 POPO

python3 send_to_popo.py output/培训材料.docx 接收人邮箱@corp.netease.com

数据文件模板

第 901 期示例数据

参考文件:data/第901期_最终版.json

包含完整的数据结构示例,可直接复制修改。

关键字段说明

舆情条目字段

字段 类型 说明 必填
no string 序号
level string 风险等级(P0/P1/P2/P3)
title string 舆情标题
source string 信息来源
content array 内容概述(字符串数组)
hidden_risks array 隐蔽风险点(重点)
legal_basis array 法规依据
control array 查删拦截要求
common_mistakes array 易错提示

隐蔽风险点编写指南

好的示例

  • ❌ 不好:"不要发布攻击领导人的内容"(太明显)
  • ✅ 好:"【影射风险】讨论中可能借台湾司法案例影射大陆司法制度,如'台湾都能判17年,大陆呢'等对比性言论"

编写要点

  1. 说明风险类型(影射、变相、借题发挥等)
  2. 给出具体示例话术
  3. 说明为什么难以识别
  4. 结合审核员画像(低素质、低主动性)

易错提示编写指南

好的示例

  • "误认为单纯讨论台湾新闻无风险,忽视影射性言论"
  • "将'家长吐槽'误认为正常讨论,忽视其中的煽动性"

编写要点

  1. 指出审核员常犯的错误
  2. 说明错误原因(经验不足、敏感度不够等)
  3. 给出正确做法

文件结构

sentiment-training/
├── config/
│   └── sources.json              # 信息源配置
├── crawler/
│   ├── __init__.py
│   └── base.py                   # 爬虫基类
├── analyzer/
│   ├── __init__.py
│   ├── classifier.py             # 内容分类器
│   ├── law_matcher.py            # 法规匹配器
│   └── risk_assessor.py          # 风险评估
├── generator/
│   ├── __init__.py
│   ├── standard_generator.py     # 标准版生成器
│   └── enhanced_generator.py     # 增强版生成器(V2.0)
├── data/
│   ├── raw/                      # 原始抓取数据
│   ├── archive/                  # 历史归档
│   └── 第901期_最终版.json       # 示例数据
├── output/                       # 输出文档
├── templates/                    # 文档模板
├── requirements.txt
├── generate_training_doc.py      # 文档生成主程序
├── send_to_popo.py               # POPO发送脚本
└── SKILL.md                      # 本说明文件

更新记录

V2.0(2026-03-27)

  • ✨ 新增智能去重功能,避免重复舆情
  • ✨ 新增隐蔽风险识别,针对低素质审核员优化
  • ✨ 新增可视化增强,表格+图标+颜色
  • ✨ 新增审核员友好设计,易错提示+实操指导
  • ✨ 新增抖音自媒体监控支持
  • 🔧 优化文档布局,减少文字堆积
  • 🔧 优化风险等级颜色标识

V1.0(2026-03-26)

  • 🎉 初始版本,支持多渠道爬虫和 POPO 文档生成
  • 🎉 支持法规条款自动关联
  • 🎉 支持封控要求生成

使用建议

针对审核主管

  1. 数据准备:提前收集舆情信息,填写 JSON 数据文件
  2. 去重检查:加载上一期数据,确保无重复
  3. 风险挖掘:重点关注隐蔽性风险点,避免 obvious 内容
  4. 定期更新:每周/每日更新,保持时效性

针对审核员

  1. 重点阅读:隐蔽风险点(红色高亮部分)
  2. 牢记易错:常见错误提示,避免踩坑
  3. 对照执行:查删拦截要求,按步骤操作
  4. 法规依据:理解为什么这样做

注意事项

  1. 时效性:确保舆情在指定时间范围内
  2. 准确性:核实舆情事实,避免虚假信息
  3. 完整性:每条舆情必须包含所有必填字段
  4. 实用性:隐蔽风险点要具体、可操作

技术支持

如有问题,请联系开发团队。

Installs
1
First Seen
Apr 7, 2026