# 多模态医学分析

Medgemma 4b It 8bit
其他
MedGemma-4B-IT-8bit是Google MedGemma模型的MLX格式转换版本,专注于医疗领域的视觉语言任务。
图像生成文本 Transformers
M
mlx-community
116
1
Medgemma 4b It
其他
MedGemma是Google开发的医疗专用多模态AI模型,基于Gemma 3架构,专注于医学文本和图像理解。
图像生成文本 Transformers
M
unsloth
223
2
Medgemma 4b It
其他
MedGemma是基于Gemma 3优化的医学多模态模型系列,专为医学文本和图像理解设计,提供4B和27B两种参数规模版本。
图像生成文本 Transformers
M
google
15.36k
259
Llama 3.2 11B Vision Radiology Mini
Apache-2.0
基于unsloth/Llama-3.2-11B-Vision-Instruct微调的放射影像辅助解读模型,优化后运行速度提升两倍
图像生成文本 Transformers 英语
L
0llheaven
885
1
Chinese LLaVA Med 7B
Apache-2.0
基于LLaVA-1.5架构的中文医疗多模态大语言模型,专注于医疗领域的视觉问答任务。
文本生成图像 Transformers 中文
C
BUAADreamer
60
4
Radllama 7b
RadLLaMA-7b是斯坦福AIMI团队开发的针对放射学领域的基础语言模型,基于LLaMA2架构。
大型语言模型 Transformers
R
StanfordAIMI
82.89k
2
Llava Roco 8bit
BabyDoctor是一个多模态大语言模型,融合了CLiP和LLaMA 2的能力,能够理解和生成文本,同时理解图像。该模型经过微调,专门用于解读X光、超声波、核磁共振和CT扫描等放射学图像。
图像生成文本 Transformers 英语
L
photonmz
29
15
Rclip
Gpl-3.0
RCLIP是基于CLIP模型在放射影像领域微调的视觉-语言模型,专为医学影像分析优化。
文本生成图像 Transformers 英语
R
kaveh
42
2
Quiltnet B 16 PMB
MIT
基于Quilt-1M病理视频数据集训练的ViT-B/16视觉编码器与PubMedBERT文本编码器多模态基础模型
图像生成文本
Q
wisdomik
513
5
Quiltnet B 32
MIT
基于Quilt-1M病理视频数据集训练的CLIP ViT-B/32视觉语言基础模型,专为病理组织学分析设计
文本生成图像
Q
wisdomik
8,442
22
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase