PEGASUS-PET-impression开源模型 - 精准生成个性化全身PET报告印象摘要

首页

PEGASUS PET Impression

由 xtie 开发

专用于PET报告发现部分摘要生成的微调版PEGASUS模型，可生成准确且个性化的全身PET报告印象。

文本生成

Transformers

英语#PET报告摘要 #个性化风格学习 #医疗文本生成

下载量 16

发布时间 : 9/3/2023

模型简介

该模型是基于PEGASUS架构微调的文本摘要模型，专门用于从PET检查发现中自动生成临床印象部分，支持学习不同医师的个性化报告风格。

模型特点

个性化报告风格

通过特殊标记编码医师身份，模型能够学习并模仿不同医师的个性化报告风格。

高临床接受率

生成的个性化印象临床接受率达89%，平均效用值4.08/5，与其他医师书写印象效用相当。

多维度评估

通过30项指标与两位核医学医师评分对比筛选最优模型，并由三位专家从6个质量维度评估。

模型能力

PET报告摘要生成

个性化风格模仿

医疗文本处理

使用案例

医疗报告自动化

PET报告印象生成

自动从PET检查发现中生成临床印象部分

临床接受率达89%，平均效用值4.08/5

医疗效率提升

医师工作辅助

帮助医师快速完成PET报告印象部分

可显著提升PET报告效率

🚀 基于大语言模型的PET报告自动个性化印象生成 📄✍

本项目利用大语言模型实现PET报告的自动个性化印象生成，解决了人工撰写PET报告印象耗时费力的问题，能够快速、准确地根据PET报告的检查结果生成个性化的临床印象，提高了PET报告的生成效率。

🚀 快速开始

模型使用示例

finetuned_model = "xtie/PEGASUS-PET-impression"
tokenizer = AutoTokenizer.from_pretrained(finetuned_model) 
model = AutoModelForSeq2SeqLM.from_pretrained(finetuned_model, ignore_mismatched_sizes=True).eval()

findings_info =
"""
Description: PET CT WHOLE BODY
Radiologist: James
Findings:
Head/Neck: xxx Chest: xxx Abdomen/Pelvis: xxx Extremities/Musculoskeletal: xxx
Indication:
The patient is a 60-year old male with a history of xxx
"""

inputs = tokenizer(findings_info.replace('\n', ' '),
                  padding="max_length",
                  truncation=True,
                  max_length=1024,
                  return_tensors="pt")
input_ids = inputs.input_ids.to("cuda")
attention_mask = inputs.attention_mask.to("cuda")
outputs = model.generate(input_ids,
                        attention_mask=attention_mask,
                        max_new_tokens=512, 
                        num_beam_groups=1,
                        num_beams=4, 
                        do_sample=False,
                        diversity_penalty=0.0,
                        num_return_sequences=1, 
                        length_penalty=2.0,
                        no_repeat_ngram_size=3,
                        early_stopping=True
                        )
# get the generated impressions
output_str = tokenizer.decode(outputs,
                              skip_special_tokens=True)

性能指标

如需详细的评估结果，请参考我们的论文。

指标	数值
ROUGE - 1	53.8
ROUGE - 2	30.9
ROUGE - L	40.0
BLEU	24.7
BERTScore	0.744

✨ 主要特性

微调后的大语言模型可根据PET检查结果提供具有临床实用价值的个性化印象。
据我们所知，这是首次尝试实现全身PET报告印象生成的自动化。

📚 详细文档

📑 模型描述

这是一个经过微调的PEGASUS模型，用于总结PET报告中的检查结果。

如需查看我们为PET报告总结微调的大语言模型（LLM），请访问以下链接：

📑 摘要

目的：确定微调后的大语言模型（LLM）是否能够为全身PET报告生成准确的个性化印象。

材料和方法：使用教师强制算法，在PET报告语料库上训练了12种语言模型，以报告检查结果为输入，临床印象为参考。额外的输入标记对阅片医生的身份进行编码，使模型能够学习医生特定的报告风格。我们的语料库包含了2010年至2022年从我们机构收集的37370份回顾性PET报告。为了确定最佳的LLM，将30种评估指标与两名核医学（NM）医生的质量评分进行基准对比，选择最匹配的指标对应的模型进行专家评估。在部分数据中，由三名NM医生根据6个质量维度和总体效用评分（5分制）对模型生成的印象和原始临床印象进行评估。每位医生审查了12份自己的报告和12份其他医生的报告。使用自助重采样进行统计分析。

结果：在所有评估指标中，经过领域适应的BARTScore和PEGASUSScore与医生偏好的Spearman's ρ相关性最高（分别为0.568和0.563）。基于这些指标，微调后的PEGASUS模型被选为最佳LLM。当医生审查以自己风格生成的PEGASUS印象时，89%被认为具有临床可接受性，平均效用评分为4.08/5。医生认为这些个性化印象在总体效用上与其他医生口述的印象相当（4.03，P = 0.41）。

结论：PEGASUS生成的个性化印象具有临床实用价值，凸显了其加快PET报告速度的潜力。

阅读完整论文

🖥️ 硬件

模型在NVIDIA A100 GPU上进行训练。

📦 额外资源

微调基础模型：Google的PEGASUS Large
训练和推理代码库：GitHub仓库

作者信息

作者：Xin Tie, Muheon Shin, Ali Pirasteh, Nevein Ibrahim, Zachary Huemann, Sharon M. Castellino, Kara Kelly, John Garrett, Junjie Hu, Steve Y. Cho, Tyler J. Bradshaw