🚀 Lingshu-32B GGUF模型
Lingshu-32B GGUF模型是適用於醫療領域的多模態大語言模型,支持多種醫學影像模態,在醫療問答和報告生成任務上表現出色。
🚀 快速開始
本項目包含論文 Lingshu: A Generalist Foundation Model for Unified Multimodal Medical Understanding and Reasoning 中的模型。同時,我們還在 MedEvalKit 中發佈了一個全面的醫學評估工具包,支持對主要多模態和文本醫學任務進行快速評估。
點擊此處獲取選擇合適GGUF模型格式的相關信息。
官網
🤖 7B模型
🤖 32B模型
MedEvalKit
技術報告
✨ 主要特性
- Lingshu 模型在7B和32B模型規模的大多數醫學多模態/文本問答和報告生成任務中達到了當前最優水平(SOTA)。
- Lingshu-32B 在大多數多模態問答和報告生成任務中表現優於GPT - 4.1和Claude Sonnet 4。
- Lingshu支持超過12種醫學影像模態,包括X光、CT掃描、MRI、顯微鏡檢查、超聲、組織病理學、皮膚鏡檢查、眼底、OCT、數碼攝影、內窺鏡檢查和PET。
📚 詳細文檔
模型生成詳情
該模型使用 llama.cpp 在提交版本 238005c2
時生成。
超越IMatrix的量化
我一直在嘗試一種新的量化方法,該方法有選擇地提高關鍵層的精度,超越了默認IMatrix配置所提供的精度。
在我的測試中,標準IMatrix量化在較低比特深度下表現不佳,尤其是對於專家混合(MoE)模型。為了解決這個問題,我使用 llama.cpp
中的 --tensor-type
選項手動將重要層的精度提高。你可以在這裡看到具體實現。
雖然這確實會增加模型文件的大小,但它顯著提高了給定量化級別的精度。
反饋徵集
我很希望得到你的反饋,你是否嘗試過這種方法?它對你來說效果如何?
模型發佈
免責聲明
我們必須指出,儘管模型權重、代碼和演示以開放方式發佈,但與其他預訓練語言模型類似,儘管我們在紅隊測試、安全微調及執行方面已盡最大努力,但我們的模型仍存在潛在風險,包括但不限於不準確、誤導性或潛在有害的生成內容。
開發者和利益相關者在部署前應進行自己的紅隊測試並提供相關安全措施,並且必須遵守當地的管理規定和法規。
在任何情況下,作者均不對因使用發佈的權重、代碼或演示而產生的任何索賠、損害或其他責任負責。
評估
醫學多模態視覺問答(VQA)
模型 |
MMMU - Med |
VQA - RAD |
SLAKE |
PathVQA |
PMC - VQA |
OmniMedVQA |
MedXpertQA |
平均 |
專有模型 |
|
|
|
|
|
|
|
|
GPT - 4.1 |
75.2 |
65.0 |
72.2 |
55.5 |
55.2 |
75.5 |
45.2 |
63.4 |
Claude Sonnet 4 |
74.6 |
67.6 |
70.6 |
54.2 |
54.4 |
65.5 |
43.3 |
61.5 |
Gemini - 2.5 - Flash |
76.9 |
68.5 |
75.8 |
55.4 |
55.4 |
71.0 |
52.8 |
65.1 |
開源模型(<10B) |
|
|
|
|
|
|
|
|
BiomedGPT |
24.9 |
16.6 |
13.6 |
11.3 |
27.6 |
27.9 |
- |
- |
Med - R1 - 2B |
34.8 |
39.0 |
54.5 |
15.3 |
47.4 |
- |
21.1 |
- |
MedVLM - R1 - 2B |
35.2 |
48.6 |
56.0 |
32.5 |
47.6 |
77.7 |
20.4 |
45.4 |
MedGemma - 4B - IT |
43.7 |
72.5 |
76.4 |
48.8 |
49.9 |
69.8 |
22.3 |
54.8 |
LLaVA - Med - 7B |
29.3 |
53.7 |
48.0 |
38.8 |
30.5 |
44.3 |
20.3 |
37.8 |
HuatuoGPT - V - 7B |
47.3 |
67.0 |
67.8 |
48.0 |
53.3 |
74.2 |
21.6 |
54.2 |
BioMediX2 - 8B |
39.8 |
49.2 |
57.7 |
37.0 |
43.5 |
63.3 |
21.8 |
44.6 |
Qwen2.5VL - 7B |
50.6 |
64.5 |
67.2 |
44.1 |
51.9 |
63.6 |
22.3 |
52.0 |
InternVL2.5 - 8B |
53.5 |
59.4 |
69.0 |
42.1 |
51.3 |
81.3 |
21.7 |
54.0 |
InternVL3 - 8B |
59.2 |
65.4 |
72.8 |
48.6 |
53.8 |
79.1 |
22.4 |
57.3 |
Lingshu - 7B |
54.0 |
67.9 |
83.1 |
61.9 |
56.3 |
82.9 |
26.7 |
61.8 |
開源模型(>10B) |
|
|
|
|
|
|
|
|
HealthGPT - 14B |
49.6 |
65.0 |
66.1 |
56.7 |
56.4 |
75.2 |
24.7 |
56.2 |
HuatuoGPT - V - 34B |
51.8 |
61.4 |
69.5 |
44.4 |
56.6 |
74.0 |
22.1 |
54.3 |
MedDr - 40B |
49.3 |
65.2 |
66.4 |
53.5 |
13.9 |
64.3 |
- |
- |
InternVL3 - 14B |
63.1 |
66.3 |
72.8 |
48.0 |
54.1 |
78.9 |
23.1 |
58.0 |
Qwen2.5V - 32B |
59.6 |
71.8 |
71.2 |
41.9 |
54.5 |
68.2 |
25.2 |
56.1 |
InternVL2.5 - 38B |
61.6 |
61.4 |
70.3 |
46.9 |
57.2 |
79.9 |
24.4 |
57.4 |
InternVL3 - 38B |
65.2 |
65.4 |
72.7 |
51.0 |
56.6 |
79.8 |
25.2 |
59.4 |
Lingshu - 32B |
62.3 |
76.5 |
89.2 |
65.9 |
57.9 |
83.4 |
30.9 |
66.6 |
醫學文本問答
模型 |
MMLU - Med |
PubMedQA |
MedMCQA |
MedQA |
Medbullets |
MedXpertQA |
SuperGPQA - Med |
平均 |
專有模型 |
|
|
|
|
|
|
|
|
GPT - 4.1 |
89.6 |
75.6 |
77.7 |
89.1 |
77.0 |
30.9 |
49.9 |
70.0 |
Claude Sonnet 4 |
91.3 |
78.6 |
79.3 |
92.1 |
80.2 |
33.6 |
56.3 |
73.1 |
Gemini - 2.5 - Flash |
84.2 |
73.8 |
73.6 |
91.2 |
77.6 |
35.6 |
53.3 |
69.9 |
開源模型(<10B) |
|
|
|
|
|
|
|
|
Med - R1 - 2B |
51.5 |
66.2 |
39.1 |
39.9 |
33.6 |
11.2 |
17.9 |
37.0 |
MedVLM - R1 - 2B |
51.8 |
66.4 |
39.7 |
42.3 |
33.8 |
11.8 |
19.1 |
37.8 |
MedGemma - 4B - IT |
66.7 |
72.2 |
52.2 |
56.2 |
45.6 |
12.8 |
21.6 |
46.8 |
LLaVA - Med - 7B |
50.6 |
26.4 |
39.4 |
42.0 |
34.4 |
9.9 |
16.1 |
31.3 |
HuatuoGPT - V - 7B |
69.3 |
72.8 |
51.2 |
52.9 |
40.9 |
10.1 |
21.9 |
45.6 |
BioMediX2 - 8B |
68.6 |
75.2 |
52.9 |
58.9 |
45.9 |
13.4 |
25.2 |
48.6 |
Qwen2.5VL - 7B |
73.4 |
76.4 |
52.6 |
57.3 |
42.1 |
12.8 |
26.3 |
48.7 |
InternVL2.5 - 8B |
74.2 |
76.4 |
52.4 |
53.7 |
42.4 |
11.6 |
26.1 |
48.1 |
InternVL3 - 8B |
77.5 |
75.4 |
57.7 |
62.1 |
48.5 |
13.1 |
31.2 |
52.2 |
Lingshu - 7B |
74.5 |
76.6 |
55.9 |
63.3 |
56.2 |
16.5 |
26.3 |
52.8 |
開源模型(>10B) |
|
|
|
|
|
|
|
|
HealthGPT - 14B |
80.2 |
68.0 |
63.4 |
66.2 |
39.8 |
11.3 |
25.7 |
50.7 |
HuatuoGPT - V - 34B |
74.7 |
72.2 |
54.7 |
58.8 |
42.7 |
11.4 |
26.5 |
48.7 |
MedDr - 40B |
65.2 |
77.4 |
38.4 |
59.2 |
44.3 |
12.0 |
24.0 |
45.8 |
InternVL3 - 14B |
81.7 |
77.2 |
62.0 |
70.1 |
49.5 |
14.1 |
37.9 |
56.1 |
Qwen2.5VL - 32B |
83.2 |
68.4 |
63.0 |
71.6 |
54.2 |
15.6 |
37.6 |
56.2 |
InternVL2.5 - 38B |
84.6 |
74.2 |
65.9 |
74.4 |
55.0 |
14.7 |
39.9 |
58.4 |
InternVL3 - 38B |
83.8 |
73.2 |
64.9 |
73.5 |
54.6 |
16.0 |
42.5 |
58.4 |
Lingshu - 32B |
84.7 |
77.8 |
66.1 |
74.7 |
65.4 |
22.7 |
41.1 |
61.8 |
醫學報告生成
模型 |
MIMIC - CXR(ROUGE - L) |
MIMIC - CXR(CIDEr) |
MIMIC - CXR(RaTE) |
MIMIC - CXR(SembScore) |
MIMIC - CXR(RadCliQ - v1-1) |
CheXpert Plus(ROUGE - L) |
CheXpert Plus(CIDEr) |
CheXpert Plus(RaTE) |
CheXpert Plus(SembScore) |
CheXpert Plus(RadCliQ - v1-1) |
IU - Xray(ROUGE - L) |
IU - Xray(CIDEr) |
IU - Xray(RaTE) |
IU - Xray(SembScore) |
IU - Xray(RadCliQ - v1-1) |
專有模型 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
GPT - 4.1 |
9.0 |
82.8 |
51.3 |
23.9 |
57.1 |
24.5 |
78.8 |
45.5 |
23.2 |
45.5 |
30.2 |
124.6 |
51.3 |
47.5 |
80.3 |
Claude Sonnet 4 |
20.0 |
56.6 |
45.6 |
19.7 |
53.4 |
22.0 |
59.5 |
43.5 |
18.9 |
43.3 |
25.4 |
88.3 |
55.4 |
41.0 |
72.1 |
Gemini - 2.5 - Flash |
25.4 |
80.7 |
50.3 |
29.7 |
59.4 |
23.6 |
72.2 |
44.3 |
27.4 |
44.0 |
33.5 |
129.3 |
55.6 |
50.9 |
91.6 |
開源模型(<10B) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Med - R1 - 2B |
19.3 |
35.4 |
40.6 |
14.8 |
42.4 |
18.6 |
37.1 |
38.5 |
17.8 |
37.6 |
16.1 |
38.3 |
41.4 |
12.5 |
43.6 |
MedVLM - R1 - 2B |
20.3 |
40.1 |
41.6 |
14.2 |
48.3 |
20.9 |
43.5 |
38.9 |
15.5 |
40.9 |
22.7 |
61.1 |
46.1 |
22.7 |
54.3 |
MedGemma - 4B - IT |
25.6 |
81.0 |
52.4 |
29.2 |
62.9 |
27.1 |
79.0 |
47.2 |
29.3 |
46.6 |
30.8 |
103.6 |
57.0 |
46.8 |
86.7 |
LLaVA - Med - 7B |
15.0 |
43.4 |
12.8 |
18.3 |
52.9 |
18.4 |
45.5 |
38.8 |
23.5 |
44.0 |
18.8 |
68.2 |
40.9 |
16.0 |
58.1 |
HuatuoGPT - V - 7B |
23.4 |
69.5 |
48.9 |
20.0 |
48.2 |
21.3 |
64.7 |
44.2 |
19.3 |
39.4 |
29.6 |
104.3 |
52.9 |
40.7 |
63.6 |
📄 許可證
本項目採用MIT許可證。