popo-excel-parser
SKILL.md
POPO Excel 解析器
用于导出和解析 POPO 团队空间中的 Excel 文件。
功能概述
- 从 POPO 团队空间导出 Excel 文件
- 解析 Excel 内容并展示关键信息
- 支持多工作表分析
- 自动识别数据类型和结构
前置条件
⚠️ 需要先将 grp.clawhivebot@corp.netease.com 添加为文档协作者
使用方法
1. 导出并解析 Excel 文件
当用户发送 POPO Excel 文件链接或要求读取时:
# 方式1: 使用 teamSpaceKey 和 pageId
python3 scripts/popo_excel_parser.py parse <teamSpaceKey> <pageId>
# 方式2: 使用完整 URL
python3 scripts/popo_excel_parser.py parse-url <url>
2. 支持的链接格式
- 团队空间文件:
https://docs.popo.netease.com/team/pc/{teamSpaceKey}/pageDetail/{pageId}
3. 参数提取
从链接中提取:
teamSpaceKey: 团队空间标识(如 pxkghxcz)pageId: 文件页面标识(如 9b133d75fcb441189480221c2aa32ab9)
输出内容
脚本会输出:
- 📁 文件基本信息(名称、大小、工作表数量)
- 📋 工作表列表
- 📑 每个工作表的详细内容:
- 行数和列数
- 列名和数据类型
- 前5行数据预览
- 非空值统计
示例
示例1: 解析马犬项目的问卷文件
python3 scripts/popo_excel_parser.py parse pxkghxcz 9b133d75fcb441189480221c2aa32ab9
输出示例:
📊 Excel 文件解析结果
📁 文件信息:
文件名: 9b133d75fcb441189480221c2aa32ab9.xlsx
文件大小: 1123.11 KB
工作表数量: 3
📋 工作表列表:
1. 样本配额
2. 大纲
3. ace 6T
📑 工作表: 样本配额
行数: 31
列数: 3
列名: 类目, 上市时间, 45996
示例2: 从 URL 解析
python3 scripts/popo_excel_parser.py parse-url "https://docs.popo.netease.com/team/pc/pxkghxcz/pageDetail/9b133d75fcb441189480221c2aa32ab9"
故障排除
权限错误
确保机器人已被添加为协作者:
- 打开 POPO 团队空间
- 点击"分享&权限"
- 添加
grp.clawhivebot@corp.netease.com
文件无法导出
- 检查文件是否为 Excel 格式(.xlsx, .xls)
- 确认文件未被删除或移动
- 检查网络连接
Token 获取失败
- 检查网络连接
- 确认 POPO 服务正常
依赖
- Python 3.8+
- pandas
- openpyxl
- requests
安装依赖
pip install pandas openpyxl requests