medical-bill-organizer
医疗票据整理助手
这个 skill 帮助用户自动整理医疗票据,包括分类、OCR识别和信息汇总。
适用场景
- 需要整理医疗报销材料
- 批量处理医疗票据图片或PDF
- 生成医疗费用报销清单
工作流程
第一步:准备输入
用户提供的输入可以是:
- 文件夹路径(包含多个图片和PDF文件)
- 压缩包路径(zip/rar/7z格式)
如果输入是压缩包,需要先解压到临时目录。
第二步:文件分类
使用 OCR 识别票据内容,根据以下分类标准进行分类,只生成有对应票据的文件夹。
分类标准
| 分类编号 | 分类名称 | 分类要求 |
|---|---|---|
| 001 | 户口本 | 包含户口簿、户口本、户口册、户口登记表、常住人口登记卡、户口迁移证等 |
| 002 | 身份证正面 | 身份证人像面,包含人像、姓名、性别、民族、出生日期、地址、身份证号 |
| 003 | 身份证背面 | 身份证国徽面,包含国徽、签发机关、有效期限 |
| 004 | 银行卡 | 银行卡、社保卡、银行卡号截图等 |
| 005 | 出生证明 | 出生证、出生医学证明、出生证明等 |
| 006 | 理赔申请书 | 包含理赔须知和理赔材料收集、个人声明和隐私声明 |
| 007 | 转账授权书 | 转账委托授权书、保险金转账委托授权书等 |
| 008 | 门急诊病历 | 门诊病历、急诊初诊病历、急诊病历、病历记录、就医记录等 |
| 009 | 入院记录 | 入院记录、住院病历、住院证、住院记录、查房记录等,包含"住院号"或"床号",无"出院时间" |
| 010 | 出院小结 | 出院小结、出院记录、出院医嘱,包含"住院号"、"入院时间"、"出院时间"、"诊疗经过"、"出院诊断"等 |
| 011 | 检查报告 | CT、MRI、DR、X线、报告单、诊断报告、B超申请单、化验单等 |
| 012 | 处方笺 | 处方笺、门诊处方笺、处方、急诊处方、处方单、处方明细等 |
| 013 | 住院诊断证明 | 标题为诊断证明书、疾病诊断书、出院证明书,同时包含"住院号"或"床号" |
| 014 | 病理报告 | 标题包含病理报告、病理检查报告,内容含有"病理诊断/病理学诊断"字段 |
| 015 | 门诊诊断证明 | 标题为诊断证明书、病情诊断证明书、门(急)诊病情证明书等 |
| 016 | 门诊费用清单 | 标题为医疗收费明细、门诊费用清单、诊疗项目收费清单等(归类到门诊电票) |
| 017 | 住院费用清单 | 标题为住院费用清单、住院病人费用明细、住院费用结算单等 |
| 018 | 门诊电票 | 门诊收费票据、发票,标题包含"门诊/急诊"和"(电子)",有二维码;门诊费用清单也归类到此类型 |
| 019 | 门诊纸票 | 门诊收费票据、发票,标题包含"门诊/急诊",无"(电子)"和二维码 |
| 020 | 住院电票 | 住院收费票据、发票,标题包含"住院"和"(电子)",有二维码 |
| 021 | 住院纸票 | 住院收费票据、发票,标题包含"住院",无"(电子)"和二维码 |
| 022 | 药房增值税发票 | 电子发票、普通发票,存在"增值税/纳税人识别号/税率",项目名称包含医疗服务、化学药品 |
| 023 | 病案首页 | 标题必须为病案首页或住院病案首页 |
| 024 | 纸质发票复印件 | 门诊/住院收费票据复印件,黑白或带"复印"字样,无彩色防伪标识 |
| 025 | 伤残鉴定报告 | 鉴定意见书、鉴定结论书等 |
| 026 | 理赔分割单 | 理赔分割单、理赔通知书、理赔核定通知书、理赔决定通知书等 |
| 027 | 交通事故认定书 | 标题为道路交通事故认定书 |
| 028 | 其他 | 不属于上述分类的材料,医保结算单也归类到此类型 |
分类原则
- 根据 OCR 识别的内容,按照分类标准进行判断
- 仔细甄别各个类型之间的联系和区别
- 如果原始是PDF包含多页,只看第一页进行分类
- 只生成有对应票据的文件夹
第三步:OCR识别和信息抽取
使用 qianfanocr-document-intelligence skill 对每个文件进行 OCR 识别。
病历信息抽取
对于病历文件(包括门急诊病历、入院记录、出院小结、住院诊断证明、门诊诊断证明),抽取以下信息:
- 住院日期 - 入院和出院日期
- 医院名称 - 就医医院的完整名称
发票信息抽取
对于发票文件(包括门诊电票、门诊纸票、住院电票、住院纸票、药房增值税发票),抽取以下字段:
- 就诊日期
- 账单金额(金额合计)
- 统筹先期给付金额(医保统筹基金支付)
- 全额自费(个人自费)
- 部分自费(个人自付)
- 第三方支付(来自理赔分割单,发票中暂无此字段,填0)
注意事项:
- 金额字段需要识别数字格式,支持小数点
- 日期格式可能是多种形式,统一转换为 YYYY-MM-DD
- 如果某个字段在发票中不存在,留空或填0
第四步:生成输出
文件夹结构
根据实际分类结果,创建对应的文件夹:
输出目录/
├── [分类名称]/ # 只生成有对应票据的文件夹
├── [分类名称]/
├── ...
└── 发票汇总.csv # 发票信息汇总表(如果有发票)
发票汇总 CSV
创建 发票汇总.csv 文件,格式如下:
| 列名 | 说明 |
|---|---|
| 发票号 | 发票号码 |
| 就诊日期 | 就诊日期(YYYY-MM-DD格式) |
| 账单金额 | 金额合计 |
| 统筹先期给付金额 | 医保统筹基金支付金额 |
| 全额自费 | 个人自费金额 |
| 部分自费 | 个人自付金额 |
| 第三方支付 | 来自理赔分割单,发票中填0 |
最后一行为合计行,对各金额列进行单独合计(除发票号和就诊日期外)。
CSV 格式示例:
发票号,就诊日期,账单金额,统筹先期给付金额,全额自费,部分自费,第三方支付
12345678,2024-03-15,1500.00,1000.00,0.00,300.00,0.00
87654321,2024-03-16,2500.00,1800.00,50.00,400.00,250.00
合计,,2800.00,50.00,700.00,250.00
注意: CSV 文件需要按就诊日期进行排序。
处理压缩包
如果输入是压缩包:
- 创建临时解压目录
- 解压文件
- 处理所有文件
- 清理临时目录(询问用户是否保留)
支持的压缩格式:
- zip
- rar
- 7z
错误处理
- 如果某个文件 OCR 失败,记录到错误日志,继续处理其他文件
- 如果发票某个字段无法识别,在 CSV 中留空
- 如果无法确定文件类型,放入"其他"文件夹
输出总结
处理完成后,向用户报告:
- 处理文件总数
- 各分类文件数量
- OCR 成功/失败数量
- 输出目录位置
- 发票总金额等关键统计信息
More from baidubce/skills
baidu-search
Search the web using Baidu AI Search Engine (BDSE). Use for live information, documentation, or research topics.
1template-skill
Replace with description of the skill and when Claude should use it.
1famou-data-analysis
数据分析技能,用于理解数据、分析数据、制作数据处理流程、汇总数据分析结果。当用户提到"分析数据"、"数据处理"、"数据探索"、"统计分析"、"数据清洗"、"数据汇总"、"制作数据报告"、"理解这份数据"、"看一下这个CSV/Excel/数据集"时,必须使用此技能。即使用户只说"帮我看看这个数据"、"分析一下",只要上下文涉及数据文件或数据集,也应立即触发此技能。如果在FaMou问题定义过程中涉及到数据分析,也需要调用此技能。
1famou-artifact-generator
交互式引导用户完成 FaMou 进化任务的完整流程:先通过结构化澄清循环产出 `problem.md`,再实现并验证 FaMou 实验的三个输入物料(`init.py`、`evaluator.py`、`prompt.md`)。当用户提到以下任意情形时触发:定义/澄清/创建 FaMou 任务、帮我写 problem.md、我想建一个进化任务、帮我准备 FaMou 实验物料、生成 init.py 或 evaluator.py、优化/ML/搜索问题需要进化求解。即使用户只说"帮我做个 FaMou 任务"或提供粗略想法,也应触发此技能并从澄清阶段开始。
1famou-result-visualization
为 FaMou 进化算法生成可行解的 Python 代码解生成可视化结果页面。当用户提到"FaMou 可视化"、"把这个解可视化"、"可行解结果展示"、"evolution 结果"、"evolve 可视化",或者提供了 Python 代码形式的问题解(路径规划、排课、背包、TSP、调度、机器学习等)需要直观展示效果时,必须使用此技能。即使用户只说"帮我可视化这个解"、"画出来看看"、"展示一下结果",只要上下文涉及进化算法、优化问题的解,也应立即触发此技能。
1