bigdata-sentiment
SKILL.md
大数据行业舆情收集技能
核心目标
本技能用于自动化收集和分析大数据行业的舆情信息,帮助用户快速了解:
- 行业新闻动态与政策变化
- 技术发展趋势与创新方向
- 竞争对手动向与市场格局
- 用户反馈与市场声量
- 投资机会与风险预警
工作流程
1. 需求确认
默认配置 (用户未明确指定时使用):
- 监控主题: 数据仓库、数据治理、AI 大模型、数据安全、数据湖、数据分析、云计算、商业智能
- 关键词列表: 大数据 + 行业术语 + 主流产品名 (如 Hadoop、Spark、Flink、Doris、Kafka 等)
- 时间范围: 近 24 小时 (每日简报)
- 优先级: 政策 > 技术 > 市场 > 资本
- 输出频率: 每日简报
2. 信息采集
使用 browser 工具或 web_fetch 工具从以下渠道采集信息:
推荐数据源
- 新闻资讯: 36 氪、虎嗅、界面新闻、财新、科技日报
- 行业媒体: 数据猿、大数据在线、中国大数据、InfoQ
- 技术社区: CSDN、掘金、知乎、SegmentFault
- 社交媒体: 微博、微信公众号、Twitter
- 官方渠道: 工信部、发改委、信通院等政府网站
- 企业动态: 目标公司官网、官方博客、财报
采集参数
- 时间窗口:近 7 天 (默认)
- 每源数量:10-20 条 (避免过载)
- 内容类型:新闻/文章/公告/评论
3. 信息筛选
对采集的内容进行筛选:
- 相关性过滤: 保留与大数据核心主题相关的内容
- 去重处理: 移除重复报道
- 质量评估: 优先保留权威来源、深度分析内容
- 时效性: 优先最新信息
4. 内容分析
对每条信息进行结构化分析:
- 标题: 原始标题
- 来源: 发布媒体/平台
- 时间: 发布时间
- 链接: 原文链接
- 摘要: 100-200 字核心内容
- 关键词: 提取 3-5 个关键词
- 情感倾向: 正面/中性/负面
- 分类: 政策/技术/市场/资本/其他
5. 输出报告
根据用户需求生成报告:
简报格式 (适合快速浏览)
# 大数据行业舆情简报 [日期范围]
## 热点 TOP5
1. [标题] - [来源] - [摘要]
2. ...
## 政策动态
- [政策名称]: [核心内容]
## 技术趋势
- [技术方向]: [关键进展]
## 市场动态
- [公司动态]: [事件描述]
## 风险提示
- [风险项]: [说明]
详细格式 (适合深度分析)
生成 Excel 表格,包含所有字段的完整信息
输出规范
基本原则
- 简洁: 每条摘要不超过 200 字
- 客观: 保持中立,标注信息来源
- 及时: 标注信息发布时间
- 可追溯: 所有信息附带原文链接
情感分析标准
- 正面: 技术突破、融资成功、政策利好、市场增长
- 中性: 产品发布、日常运营、人事变动
- 负面: 安全事件、裁员、处罚、业绩下滑
工具使用
浏览器自动化 (browser)
用于:
- 访问需要登录或动态加载的网站
- 执行复杂搜索
- 截取关键信息截图
网页抓取 (web_fetch)
用于:
- 快速获取新闻文章全文
- 提取结构化内容
文档生成 (docx / xlsx)
用于:
- 生成正式报告文档
- 创建结构化数据表格
注意事项
- 合规性: 遵守各平台 robots.txt 和使用条款
- 版权: 转载或引用时注明出处
- 隐私: 不涉及个人隐私信息
- 准确性: 重要信息需要交叉验证
- 时效性: 标注数据截止时间
示例输出
示例:每日简报模板
# 大数据行业舆情日报 2026-03-30
**数据截止时间**: 2026-03-30 17:00
**监测范围**: 数据仓库 | 数据治理 | AI 大模型 | 数据安全 | 数据湖 | 数据分析 | 云计算 | 商业智能
---
## 🔥 今日热点 TOP5
1. **阿里云发布新一代数据湖架构** - 36 氪
支持 PB 级实时分析,成本降低 50%
2. **工信部推进工业大数据应用试点** - 中国日报
首批 10 个试点城市公布
3. **Apache Doris 4.0 发布** - InfoQ
查询性能提升 10 倍,兼容 MySQL 协议
4. **星环科技完成 D 轮融资 5 亿元** - 投中网
资金用于大模型与数据仓库融合研发
5. **某云服务商数据泄露事件** - 安全客
影响约 100 万用户,已启动应急响应
---
## 📋 政策动态
- **工信部**: 推进工业大数据应用试点工作,首批 10 个城市入选
- **发改委**: 支持数据要素市场化配置改革
---
## 💻 技术趋势
- **数据湖**: 阿里云发布新一代架构,支持 PB 级实时分析
- **数据仓库**: Apache Doris 4.0 发布,性能大幅提升
- **AI 大模型**: 多家厂商推出大数据 + 大模型融合方案
---
## 📊 市场动态
- **融资事件**: 星环科技 D 轮 5 亿元,明略科技 E 轮 3 亿元
- **产品发布**: 华为云 DataArts 新版上线
- **合作签约**: 腾讯云与某省达成战略合作
---
## ⚠️ 风险提示
- **安全事件**: 某云服务商数据泄露,影响 100 万用户
- **监管处罚**: 某企业因数据违规使用被处罚
---
**完整数据表**: 如需 Excel 详细版 (含链接/摘要/情感分析),请回复"导出 Excel"
Excel 字段说明
| 字段 | 说明 |
|---|---|
| 标题 | 原始标题 |
| 来源 | 发布媒体/平台 |
| 时间 | 发布时间 |
| 链接 | 原文链接 |
| 摘要 | 100-200 字核心内容 |
| 关键词 | 3-5 个关键词 |
| 情感 | 正面/中性/负面 |
| 分类 | 政策/技术/市场/资本/其他 |
优化建议
提高收集效率
- 使用 RSS 订阅源 (如有)
- 设置 Google Alert 关键词提醒
- 关注行业 KOL 社交媒体账号
提升分析质量
- 建立关键词词库并持续优化
- 训练情感分析模型 (高级用法)
- 与历史数据对比发现趋势
自动化扩展
- 设置定时任务每日自动收集
- 集成消息推送 (微信/邮件)
- 建立舆情预警机制 (负面信息即时通知)