qwen25-05b-multiclinsum-distil開源文本模型 - 免費支持多語言臨床報告摘要生成

首頁

Qwen25 05b Multiclinsum Distil

由nicolay-r開發

本模型是基於 Qwen2.5-0.5B-Instruct 微調的文本生成模型，專注於多語言臨床報告摘要生成任務。

大型語言模型

Transformers

支持多種語言開源協議:MIT #臨床報告摘要生成 #多語言醫療文本處理 #蒸餾微調模型

下載量 147

發布時間 : 6/2/2025

模型概述

該模型在 MultiClinSum 數據集上進行微調，專門用於生物醫學領域的臨床報告摘要生成，支持英語、法語、葡萄牙語和西班牙語。

模型特點

多語言支持

專門針對英語、法語、葡萄牙語和西班牙語的臨床報告進行優化

知識蒸餾

使用 Qwen2.5-72B-Instruct 生成 rationale 進行知識蒸餾

高效微調

在 A100 GPU 上僅需約1小時即可完成微調

模型能力

臨床報告摘要生成

多語言文本處理

生物醫學信息提取

使用案例

醫療健康

臨床報告自動摘要

自動生成患者臨床報告的簡明摘要

提高醫療專業人員處理信息的效率

跨語言醫療信息處理

處理不同語言的臨床報告並生成統一格式的摘要

促進國際醫療信息交流

🚀 文本生成模型

本模型專注於文本生成領域，特別是臨床報告摘要生成。它基於 Qwen/Qwen2.5-0.5B-Instruct 模型進行微調，在多語言臨床報告摘要任務中表現出色，為生物醫學領域的信息處理提供了高效解決方案。

🚀 快速開始

本模型是 Qwen/Qwen2.5-0.5B-Instruct 在 MultiClinSum 訓練數據及其 rationale 上的蒸餾微調版本。該模型的結果用於提交 BioASQ-2025 研討會 / CLEF 2025 的相關成果。

模型圖片

我們首先採用 Qwen/Qwen2.5-72B-Instruct 為訓練數據推斷 rationale（更多細節請繼續閱讀）。

基線版本：https://huggingface.co/nicolay-r/qwen25-05b-multiclinsum-standard

✨ 主要特性

模型類型：基於解碼器的模型
支持語言（NLP）：Qwen2.5 原生支持語言，並在 en、fr、pt、es 語言的摘要上進行了微調
許可證：MIT
微調基礎模型：https://huggingface.co/Qwen/Qwen2.5-0.5B-Instruct

屬性	詳情
模型類型	基於解碼器的模型
支持語言（NLP）	Qwen2.5 原生支持語言，並在 `en`、`fr`、`pt`、`es` 語言的摘要上進行了微調
許可證	MIT
微調基礎模型	https://huggingface.co/Qwen/Qwen2.5-0.5B-Instruct

📦 安裝指南

暫未提供相關安裝步驟。

💻 使用示例

基礎用法

from bulk_chain.api import iter_content
from bulk_chain.core.utils import dynamic_init

content_it = iter_content(
  schema={"schema": [
      {"prompt": "Summarize: {input}", "out": "summary"}]
  },
  llm=dynamic_init(
    class_filepath="huggingface_qwen.py",
    class_name="Qwen2")(
      api_token="YOUR_HF_API_KEY_GOES_HERE",
      model_name="nicolay-r/qwen25-05b-multiclinsum-distil",
      temp=0.1,
      use_bf16=True,
      max_new_tokens=args.max_tokens,
      device=args.device
  ),
  infer_mode="batch",
  batch_size=4,
  return_mode="record",
  # INPUT TEXTS:
  input_dicts_it=[
     {"input": "A patient 62 years old with ..."}
  ],
)

for record in content_it:
  # here is the result dictionary that includes summary.
  print(record["summary"])

高級用法

暫未提供相關高級用法示例。

📚 詳細文檔

模型來源

代碼倉庫：https://github.com/nicolay-r/distil-tuning-llm
論文：待公佈
演示：https://colab.research.google.com/drive/1TXGaz39o73nBucEQw12gbad7Tw11j2Ol?usp=sharing

🔧 技術細節

訓練數據

MultiClinSum
- 我們使用以下腳本下載數據集。
- 官網：https://temu.bsc.es/multiclinsum
- 數據：https://zenodo.org/records/15463353
- BioASQ：http://bioasq.org/

訓練過程

訓練過程包括：

為摘要蒸餾準備 rationale。
啟動微調過程。

準備工作：我們採用 Qwen/Qwen2.5-72B-Instruct 通過以下腳本來推斷 rationale：

https://github.com/nicolay-r/distil-tuning-llm/blob/master/predict/annotate_train_rationale.py
上述腳本依賴 open-router 作為遠程 API 提供者：https://openrouter.ai/qwen/qwen-2.5-72b-instruct

微調：請遵循此腳本，在 GoogleColab A100（40GB VRAM）+ 80GB RAM 上使用 MultiClinSum 數據集進行微調：

https://github.com/nicolay-r/distil-tuning-llm/blob/master/distil_ft_qwen25_05b_A100-40GB_80GB_dis.sh

預處理

參考以下腳本進行 微調 預處理：

https://github.com/nicolay-r/distil-tuning-llm/blob/master/resources/make_dataset_mult.py

訓練超參數

我們參考原始參數：

https://github.com/QwenLM/Qwen2.5-VL/tree/main/qwen-vl-finetune 並使用以下腳本：
https://github.com/nicolay-r/distil-tuning-llm/blob/master/distil_ft_qwen25_05b_A100-40GB_80GB_dis.sh