analysis-scene-generator
SKILL.md
分析场景生成器
此技能使用DeepSeek AI能力为任何行业生成通用的分析场景和相应的模拟数据。
何时使用
在以下情况下调用此技能:
- 用户需要为特定行业创建分析场景
- 用户需要模拟数据来测试分析系统
- 用户想要探索业务问题的不同分析角度
必需输入
- 行业(必填):客户所在的行业(例如:零售、金融、医疗)
- 痛点问题/需求(必填):需要分析的具体业务问题或需求
此技能的功能
-
生成分析场景:使用DeepSeek AI创建:
- 基础分析场景
- 衍生分析场景
- 交叉分析场景
- 针对行业和问题域的多角度分析场景
-
创建数据表结构:基于生成的分析场景,创建相应的数据库表结构
-
生成模拟数据:为表填充可测试的虚拟数据(每个表50行)
-
处理API限制:实现批处理以处理DeepSeek API的字符限制
-
导出到Excel:创建三个Excel文件(默认保存到桌面):
-
文件1:
{行业}-场景集-yyyy-mm-dd.xlsx- 包含"场景集"页,包含列:分析场景类型、分析场景名称、对应表名、中文表名
-
文件2:
分析场景表结构-yyyy-mm-dd.xlsx- 每个表结构一页,sheet页名称为表名
- 每页包含列:字段名、字段类型、字段中文名称
-
文件3:
{行业}-模拟数据集-yyyy-mm-dd.xlsx- 每个数据表一页
- 每页包含50行模拟数据
- 字段与文件2中定义的结构匹配
-
使用方法
此技能会提示输入必需的信息,并自动生成所有输出。
API密钥管理
此技能支持使用多个DeepSeek API密钥并行生成模拟数据:
- 密钥1(structure):用于生成表结构和分析场景
- 密钥2+(data):用于并行生成模拟数据
这种设计允许您:
- 将表结构生成和模拟数据生成分配到不同的API配额
- 并行处理多个表的模拟数据生成,提高效率
- 更好地管理和监控API使用情况
- 提高任务执行的可靠性
密钥配置方式
方式1:使用同一个密钥(默认)
- 系统会提示输入一个API密钥,用于所有任务
- 适合API配额充足的场景
方式2:使用两个不同的密钥
- 系统首先提示输入表结构/场景生成的密钥
- 然后询问是否使用另一个密钥生成模拟数据
- 适合需要分离API配额的场景
方式3:使用多个密钥并行生成模拟数据
- 通过编程方式传入API密钥列表
- 系统会自动使用这些密钥并行生成模拟数据
- 适合需要提高生成效率的场景
密钥管理功能
- 首次使用:系统会提示您输入API密钥,该密钥将保存在本地
- 后续使用:技能会自动使用您保存的API密钥
- 更新密钥:您可以随时选择更新您的API密钥
- 清除密钥:如果需要,您可以清除已保存的API密钥
API密钥保存在:~/.analysis_scene_generator/config.json
配置文件中包含两个密钥:
api_key_structure:用于生成表结构和分析场景api_key_data:用于生成模拟数据
分批处理
此技能采用分批处理策略,确保数据生成的可靠性:
第一批:场景和表结构
- 生成分析场景集
- 生成所有表结构
- 立即导出场景集和表结构文件
- 优势:即使后续步骤失败,前面的结果也已保存
第二批:模拟数据
- 使用多密钥并行生成模拟数据
- 支持哈希轮询算法分配任务
- 最后导出模拟数据文件
- 优势:提高生成效率,充分利用多个API密钥
运行技能
方式1:交互模式
python .trae/skills/analysis-scene-generator/analysis_scene_generator.py
方式2:使用示例脚本
python .trae/skills/analysis-scene-generator/example_usage.py
方式3:编程方式使用
from analysis_scene_generator import AnalysisSceneWorkflow, ConfigManager
# 首先保存API密钥(只需一次)
config_manager = ConfigManager()
config_manager.save_api_key("your_deepseek_api_key")
# 自动使用已保存的API密钥
workflow = AnalysisSceneWorkflow()
result = workflow.run("零售", "客户流失分析")
依赖项
- DeepSeek API访问(需要API密钥)
- Python库:
openpyxl、requests、pandas