popo-sav-parser-stable
SKILL.md
POPO SAV 解析器(高稳定版)
用于导出和解析 POPO 团队空间中的 SPSS (.sav) 数据文件。
功能概述
- 从 POPO 团队空间导出 .sav 文件
- 使用纯 pyreadstat 解析 SPSS 数据(高稳定性)
- 显示数据结构和变量信息
- 导出为 Excel 或 CSV 格式
- 支持数据预览
前置条件
⚠️ 需要先将 grp.clawhivebot@corp.netease.com 添加为文档协作者
依赖安装
pip install pyreadstat pandas requests
使用方法
1. 解析 POPO SPSS 文件
# 方式一:使用 teamSpaceKey 和 pageId
python3 popo_sav_parser_stable.py parse <teamSpaceKey> <pageId> --output-format excel
# 方式二:使用完整 URL
python3 popo_sav_parser_stable.py parse-url "https://docs.popo.netease.com/team/pc/xxx/pageDetail/xxx" --output-format excel
2. 参数说明
--output-format excel|csv:导出格式(可选,默认不导出)--output-path <path>:输出文件路径(可选)
3. 示例
# 导出为 Excel
python3 popo_sav_parser_stable.py parse fty4ceq6 37445c2e5c0a46769a56ea25cc37654b --output-format excel --output-path 问卷数据.xlsx
# 导出为 CSV
python3 popo_sav_parser_stable.py parse fty4ceq6 37445c2e5c0a46769a56ea25cc37654b --output-format csv
输出内容
脚本会输出:
- 文件基本信息(名称、大小、样本量、变量数)
- 变量列表(变量名、标签)
- 数据预览(前5行)
- 变量信息 Excel 文件
- 数据 Excel/CSV 文件(如指定导出)
支持的链接格式
- 团队空间文件:
https://docs.popo.netease.com/team/pc/{teamSpaceKey}/pageDetail/{pageId}
故障排除
权限错误
确保机器人已被添加为协作者:
- 打开 POPO 团队空间
- 点击"分享&权限"
- 添加
grp.clawhivebot@corp.netease.com
文件无法导出
- 检查文件是否为 .sav 格式
- 确认文件未被删除或移动
- 检查网络连接
依赖
- Python 3.8+
- pyreadstat
- pandas
- requests
版本说明
高稳定版特点:
- 纯 pyreadstat 实现,无 savReaderWriter 兼容性问题
- 支持 Python 3.11+
- 经过多个 SPSS 文件测试验证