medical-bill-organizer

Installation
SKILL.md

医疗票据整理助手

这个 skill 帮助用户自动整理医疗票据,包括分类、OCR识别和信息汇总。

适用场景

  • 需要整理医疗报销材料
  • 批量处理医疗票据图片或PDF
  • 生成医疗费用报销清单

工作流程

第一步:准备输入

用户提供的输入可以是:

  • 文件夹路径(包含多个图片和PDF文件)
  • 压缩包路径(zip/rar/7z格式)

如果输入是压缩包,需要先解压到临时目录。

第二步:文件分类

使用 OCR 识别票据内容,根据以下分类标准进行分类,只生成有对应票据的文件夹

分类标准

分类编号 分类名称 分类要求
001 户口本 包含户口簿、户口本、户口册、户口登记表、常住人口登记卡、户口迁移证等
002 身份证正面 身份证人像面,包含人像、姓名、性别、民族、出生日期、地址、身份证号
003 身份证背面 身份证国徽面,包含国徽、签发机关、有效期限
004 银行卡 银行卡、社保卡、银行卡号截图等
005 出生证明 出生证、出生医学证明、出生证明等
006 理赔申请书 包含理赔须知和理赔材料收集、个人声明和隐私声明
007 转账授权书 转账委托授权书、保险金转账委托授权书等
008 门急诊病历 门诊病历、急诊初诊病历、急诊病历、病历记录、就医记录等
009 入院记录 入院记录、住院病历、住院证、住院记录、查房记录等,包含"住院号"或"床号",无"出院时间"
010 出院小结 出院小结、出院记录、出院医嘱,包含"住院号"、"入院时间"、"出院时间"、"诊疗经过"、"出院诊断"等
011 检查报告 CT、MRI、DR、X线、报告单、诊断报告、B超申请单、化验单等
012 处方笺 处方笺、门诊处方笺、处方、急诊处方、处方单、处方明细等
013 住院诊断证明 标题为诊断证明书、疾病诊断书、出院证明书,同时包含"住院号"或"床号"
014 病理报告 标题包含病理报告、病理检查报告,内容含有"病理诊断/病理学诊断"字段
015 门诊诊断证明 标题为诊断证明书、病情诊断证明书、门(急)诊病情证明书等
016 门诊费用清单 标题为医疗收费明细、门诊费用清单、诊疗项目收费清单等(归类到门诊电票)
017 住院费用清单 标题为住院费用清单、住院病人费用明细、住院费用结算单等
018 门诊电票 门诊收费票据、发票,标题包含"门诊/急诊"和"(电子)",有二维码;门诊费用清单也归类到此类型
019 门诊纸票 门诊收费票据、发票,标题包含"门诊/急诊",无"(电子)"和二维码
020 住院电票 住院收费票据、发票,标题包含"住院"和"(电子)",有二维码
021 住院纸票 住院收费票据、发票,标题包含"住院",无"(电子)"和二维码
022 药房增值税发票 电子发票、普通发票,存在"增值税/纳税人识别号/税率",项目名称包含医疗服务、化学药品
023 病案首页 标题必须为病案首页或住院病案首页
024 纸质发票复印件 门诊/住院收费票据复印件,黑白或带"复印"字样,无彩色防伪标识
025 伤残鉴定报告 鉴定意见书、鉴定结论书等
026 理赔分割单 理赔分割单、理赔通知书、理赔核定通知书、理赔决定通知书等
027 交通事故认定书 标题为道路交通事故认定书
028 其他 不属于上述分类的材料,医保结算单也归类到此类型

分类原则

  1. 根据 OCR 识别的内容,按照分类标准进行判断
  2. 仔细甄别各个类型之间的联系和区别
  3. 如果原始是PDF包含多页,只看第一页进行分类
  4. 只生成有对应票据的文件夹

第三步:OCR识别和信息抽取

使用 qianfanocr-document-intelligence skill 对每个文件进行 OCR 识别。

病历信息抽取

对于病历文件(包括门急诊病历、入院记录、出院小结、住院诊断证明、门诊诊断证明),抽取以下信息:

  • 住院日期 - 入院和出院日期
  • 医院名称 - 就医医院的完整名称

发票信息抽取

对于发票文件(包括门诊电票、门诊纸票、住院电票、住院纸票、药房增值税发票),抽取以下字段:

  • 就诊日期
  • 账单金额(金额合计)
  • 统筹先期给付金额(医保统筹基金支付)
  • 全额自费(个人自费)
  • 部分自费(个人自付)
  • 第三方支付(来自理赔分割单,发票中暂无此字段,填0)

注意事项:

  • 金额字段需要识别数字格式,支持小数点
  • 日期格式可能是多种形式,统一转换为 YYYY-MM-DD
  • 如果某个字段在发票中不存在,留空或填0

第四步:生成输出

文件夹结构

根据实际分类结果,创建对应的文件夹:

输出目录/
├── [分类名称]/     # 只生成有对应票据的文件夹
├── [分类名称]/
├── ...
└── 发票汇总.csv    # 发票信息汇总表(如果有发票)

发票汇总 CSV

创建 发票汇总.csv 文件,格式如下:

列名 说明
发票号 发票号码
就诊日期 就诊日期(YYYY-MM-DD格式)
账单金额 金额合计
统筹先期给付金额 医保统筹基金支付金额
全额自费 个人自费金额
部分自费 个人自付金额
第三方支付 来自理赔分割单,发票中填0

最后一行为合计行,对各金额列进行单独合计(除发票号和就诊日期外)。

CSV 格式示例:

发票号,就诊日期,账单金额,统筹先期给付金额,全额自费,部分自费,第三方支付
12345678,2024-03-15,1500.00,1000.00,0.00,300.00,0.00
87654321,2024-03-16,2500.00,1800.00,50.00,400.00,250.00
合计,,2800.00,50.00,700.00,250.00

注意: CSV 文件需要按就诊日期进行排序。

处理压缩包

如果输入是压缩包:

  1. 创建临时解压目录
  2. 解压文件
  3. 处理所有文件
  4. 清理临时目录(询问用户是否保留)

支持的压缩格式:

  • zip
  • rar
  • 7z

错误处理

  • 如果某个文件 OCR 失败,记录到错误日志,继续处理其他文件
  • 如果发票某个字段无法识别,在 CSV 中留空
  • 如果无法确定文件类型,放入"其他"文件夹

输出总结

处理完成后,向用户报告:

  • 处理文件总数
  • 各分类文件数量
  • OCR 成功/失败数量
  • 输出目录位置
  • 发票总金额等关键统计信息
Related skills

More from baidubce/skills

Installs
1
Repository
baidubce/skills
GitHub Stars
19
First Seen
Apr 13, 2026