Lingshu-32B-GGUF开源医疗大模型 - 支持多影像模态，问答报告生成超实用

Home

Lingshu 32B GGUF

Developed by Mungert

Lingshu-32B GGUF模型是适用于医疗领域的多模态大语言模型，支持多种医学影像模态，在医疗问答和报告生成任务上表现出色。

文本生成图像

Transformers

Open Source License:MIT #医疗多模态 #医学影像分析 #医疗问答SOTA

Downloads 3,975

Release Time : 6/20/2025

Model Overview

Lingshu-32B是一个通用的多模态医学理解和推理基础模型，支持超过12种医学影像模态，在医疗问答和报告生成任务上达到SOTA水平。

Model Features

多模态医学理解

支持超过12种医学影像模态，包括X光、CT扫描、MRI等

超越IMatrix的量化

采用选择性提高关键层精度的新量化方法，显著提升低比特深度下的精度

医疗领域SOTA性能

在大多数医学多模态/文本问答和报告生成任务中达到当前最优水平

大模型规模

提供7B和32B两种模型规模，满足不同场景需求

Model Capabilities

医学影像分析

医疗问答

医学报告自动生成

多模态医学理解

医学文本处理

Use Cases

医疗诊断辅助

医学影像解读

自动分析X光、CT等医学影像并提供诊断建议

在MMMU-Med等数据集上表现优于GPT-4.1和Claude Sonnet 4

医疗问答系统

回答医学专业问题，提供诊断和治疗建议

在PubMedQA等文本问答任务中达到SOTA

医疗文档生成

医学报告自动生成

根据医学影像自动生成诊断报告

在MIMIC-CXR等报告生成任务中表现优异

🚀 Lingshu-32B GGUF模型

Lingshu-32B GGUF模型是适用于医疗领域的多模态大语言模型，支持多种医学影像模态，在医疗问答和报告生成任务上表现出色。

🚀 快速开始

本项目包含论文 Lingshu: A Generalist Foundation Model for Unified Multimodal Medical Understanding and Reasoning 中的模型。同时，我们还在 MedEvalKit 中发布了一个全面的医学评估工具包，支持对主要多模态和文本医学任务进行快速评估。

点击此处获取选择合适GGUF模型格式的相关信息。

官网 🤖 7B模型 🤖 32B模型 MedEvalKit 技术报告

✨ 主要特性

Lingshu 模型在7B和32B模型规模的大多数医学多模态/文本问答和报告生成任务中达到了当前最优水平（SOTA）。
Lingshu-32B 在大多数多模态问答和报告生成任务中表现优于GPT - 4.1和Claude Sonnet 4。
Lingshu支持超过12种医学影像模态，包括X光、CT扫描、MRI、显微镜检查、超声、组织病理学、皮肤镜检查、眼底、OCT、数码摄影、内窥镜检查和PET。

📚 详细文档

模型生成详情

该模型使用 llama.cpp 在提交版本 238005c2 时生成。

超越IMatrix的量化

我一直在尝试一种新的量化方法，该方法有选择地提高关键层的精度，超越了默认IMatrix配置所提供的精度。

在我的测试中，标准IMatrix量化在较低比特深度下表现不佳，尤其是对于专家混合（MoE）模型。为了解决这个问题，我使用 llama.cpp 中的 --tensor-type 选项手动将重要层的精度提高。你可以在这里看到具体实现。

虽然这确实会增加模型文件的大小，但它显著提高了给定量化级别的精度。

反馈征集

我很希望得到你的反馈，你是否尝试过这种方法？它对你来说效果如何？

模型发布

技术报告：Arxiv: Lingshu: A Generalist Foundation Model for Unified Multimodal Medical Understanding and Reasoning
模型权重：
- Lingshu-7B
- Lingshu-32B

免责声明

我们必须指出，尽管模型权重、代码和演示以开放方式发布，但与其他预训练语言模型类似，尽管我们在红队测试、安全微调及执行方面已尽最大努力，但我们的模型仍存在潜在风险，包括但不限于不准确、误导性或潜在有害的生成内容。

开发者和利益相关者在部署前应进行自己的红队测试并提供相关安全措施，并且必须遵守当地的管理规定和法规。

在任何情况下，作者均不对因使用发布的权重、代码或演示而产生的任何索赔、损害或其他责任负责。

评估

医学多模态视觉问答（VQA）

模型	MMMU - Med	VQA - RAD	SLAKE	PathVQA	PMC - VQA	OmniMedVQA	MedXpertQA	平均
专有模型
GPT - 4.1	75.2	65.0	72.2	55.5	55.2	75.5	45.2	63.4
Claude Sonnet 4	74.6	67.6	70.6	54.2	54.4	65.5	43.3	61.5
Gemini - 2.5 - Flash	76.9	68.5	75.8	55.4	55.4	71.0	52.8	65.1
开源模型（<10B）
BiomedGPT	24.9	16.6	13.6	11.3	27.6	27.9	-	-
Med - R1 - 2B	34.8	39.0	54.5	15.3	47.4	-	21.1	-
MedVLM - R1 - 2B	35.2	48.6	56.0	32.5	47.6	77.7	20.4	45.4
MedGemma - 4B - IT	43.7	72.5	76.4	48.8	49.9	69.8	22.3	54.8
LLaVA - Med - 7B	29.3	53.7	48.0	38.8	30.5	44.3	20.3	37.8
HuatuoGPT - V - 7B	47.3	67.0	67.8	48.0	53.3	74.2	21.6	54.2
BioMediX2 - 8B	39.8	49.2	57.7	37.0	43.5	63.3	21.8	44.6
Qwen2.5VL - 7B	50.6	64.5	67.2	44.1	51.9	63.6	22.3	52.0
InternVL2.5 - 8B	53.5	59.4	69.0	42.1	51.3	81.3	21.7	54.0
InternVL3 - 8B	59.2	65.4	72.8	48.6	53.8	79.1	22.4	57.3
Lingshu - 7B	54.0	67.9	83.1	61.9	56.3	82.9	26.7	61.8
开源模型（>10B）
HealthGPT - 14B	49.6	65.0	66.1	56.7	56.4	75.2	24.7	56.2
HuatuoGPT - V - 34B	51.8	61.4	69.5	44.4	56.6	74.0	22.1	54.3
MedDr - 40B	49.3	65.2	66.4	53.5	13.9	64.3	-	-
InternVL3 - 14B	63.1	66.3	72.8	48.0	54.1	78.9	23.1	58.0
Qwen2.5V - 32B	59.6	71.8	71.2	41.9	54.5	68.2	25.2	56.1
InternVL2.5 - 38B	61.6	61.4	70.3	46.9	57.2	79.9	24.4	57.4
InternVL3 - 38B	65.2	65.4	72.7	51.0	56.6	79.8	25.2	59.4
Lingshu - 32B	62.3	76.5	89.2	65.9	57.9	83.4	30.9	66.6

医学文本问答

模型	MMLU - Med	PubMedQA	MedMCQA	MedQA	Medbullets	MedXpertQA	SuperGPQA - Med	平均
专有模型
GPT - 4.1	89.6	75.6	77.7	89.1	77.0	30.9	49.9	70.0
Claude Sonnet 4	91.3	78.6	79.3	92.1	80.2	33.6	56.3	73.1
Gemini - 2.5 - Flash	84.2	73.8	73.6	91.2	77.6	35.6	53.3	69.9
开源模型（<10B）
Med - R1 - 2B	51.5	66.2	39.1	39.9	33.6	11.2	17.9	37.0
MedVLM - R1 - 2B	51.8	66.4	39.7	42.3	33.8	11.8	19.1	37.8
MedGemma - 4B - IT	66.7	72.2	52.2	56.2	45.6	12.8	21.6	46.8
LLaVA - Med - 7B	50.6	26.4	39.4	42.0	34.4	9.9	16.1	31.3
HuatuoGPT - V - 7B	69.3	72.8	51.2	52.9	40.9	10.1	21.9	45.6
BioMediX2 - 8B	68.6	75.2	52.9	58.9	45.9	13.4	25.2	48.6
Qwen2.5VL - 7B	73.4	76.4	52.6	57.3	42.1	12.8	26.3	48.7
InternVL2.5 - 8B	74.2	76.4	52.4	53.7	42.4	11.6	26.1	48.1
InternVL3 - 8B	77.5	75.4	57.7	62.1	48.5	13.1	31.2	52.2
Lingshu - 7B	74.5	76.6	55.9	63.3	56.2	16.5	26.3	52.8
开源模型（>10B）
HealthGPT - 14B	80.2	68.0	63.4	66.2	39.8	11.3	25.7	50.7
HuatuoGPT - V - 34B	74.7	72.2	54.7	58.8	42.7	11.4	26.5	48.7
MedDr - 40B	65.2	77.4	38.4	59.2	44.3	12.0	24.0	45.8
InternVL3 - 14B	81.7	77.2	62.0	70.1	49.5	14.1	37.9	56.1
Qwen2.5VL - 32B	83.2	68.4	63.0	71.6	54.2	15.6	37.6	56.2
InternVL2.5 - 38B	84.6	74.2	65.9	74.4	55.0	14.7	39.9	58.4
InternVL3 - 38B	83.8	73.2	64.9	73.5	54.6	16.0	42.5	58.4
Lingshu - 32B	84.7	77.8	66.1	74.7	65.4	22.7	41.1	61.8

医学报告生成

模型	MIMIC - CXR（ROUGE - L）	MIMIC - CXR（CIDEr）	MIMIC - CXR（RaTE）	MIMIC - CXR（SembScore）	MIMIC - CXR（RadCliQ - v1^-1）	CheXpert Plus（ROUGE - L）	CheXpert Plus（CIDEr）	CheXpert Plus（RaTE）	CheXpert Plus（SembScore）	CheXpert Plus（RadCliQ - v1^-1）	IU - Xray（ROUGE - L）	IU - Xray（CIDEr）	IU - Xray（RaTE）	IU - Xray（SembScore）	IU - Xray（RadCliQ - v1^-1）
专有模型
GPT - 4.1	9.0	82.8	51.3	23.9	57.1	24.5	78.8	45.5	23.2	45.5	30.2	124.6	51.3	47.5	80.3
Claude Sonnet 4	20.0	56.6	45.6	19.7	53.4	22.0	59.5	43.5	18.9	43.3	25.4	88.3	55.4	41.0	72.1
Gemini - 2.5 - Flash	25.4	80.7	50.3	29.7	59.4	23.6	72.2	44.3	27.4	44.0	33.5	129.3	55.6	50.9	91.6
开源模型（<10B）
Med - R1 - 2B	19.3	35.4	40.6	14.8	42.4	18.6	37.1	38.5	17.8	37.6	16.1	38.3	41.4	12.5	43.6
MedVLM - R1 - 2B	20.3	40.1	41.6	14.2	48.3	20.9	43.5	38.9	15.5	40.9	22.7	61.1	46.1	22.7	54.3
MedGemma - 4B - IT	25.6	81.0	52.4	29.2	62.9	27.1	79.0	47.2	29.3	46.6	30.8	103.6	57.0	46.8	86.7
LLaVA - Med - 7B	15.0	43.4	12.8	18.3	52.9	18.4	45.5	38.8	23.5	44.0	18.8	68.2	40.9	16.0	58.1
HuatuoGPT - V - 7B	23.4	69.5	48.9	20.0	48.2	21.3	64.7	44.2	19.3	39.4	29.6	104.3	52.9	40.7	63.6