多模态医学分析

# 多模态医学分析

Medgemma 4b It 8bit

MedGemma-4B-IT-8bit是Google MedGemma模型的MLX格式转换版本，专注于医疗领域的视觉语言任务。

图像生成文本

MedGemma是Google开发的医疗专用多模态AI模型，基于Gemma 3架构，专注于医学文本和图像理解。

图像生成文本

MedGemma是基于Gemma 3优化的医学多模态模型系列，专为医学文本和图像理解设计，提供4B和27B两种参数规模版本。

图像生成文本

Llama 3.2 11B Vision Radiology Mini

基于unsloth/Llama-3.2-11B-Vision-Instruct微调的放射影像辅助解读模型，优化后运行速度提升两倍

图像生成文本

Transformers 英语

Chinese LLaVA Med 7B

基于LLaVA-1.5架构的中文医疗多模态大语言模型，专注于医疗领域的视觉问答任务。

文本生成图像

Transformers 中文

RadLLaMA-7b是斯坦福AIMI团队开发的针对放射学领域的基础语言模型，基于LLaMA2架构。

大型语言模型

Llava Roco 8bit

BabyDoctor是一个多模态大语言模型，融合了CLiP和LLaMA 2的能力，能够理解和生成文本，同时理解图像。该模型经过微调，专门用于解读X光、超声波、核磁共振和CT扫描等放射学图像。

图像生成文本

Transformers 英语

RCLIP是基于CLIP模型在放射影像领域微调的视觉-语言模型，专为医学影像分析优化。

文本生成图像

Transformers 英语

Quiltnet B 16 PMB

基于Quilt-1M病理视频数据集训练的ViT-B/16视觉编码器与PubMedBERT文本编码器多模态基础模型

图像生成文本

基于Quilt-1M病理视频数据集训练的CLIP ViT-B/32视觉语言基础模型，专为病理组织学分析设计

文本生成图像

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

English 简体中文繁體中文にほんご

© 2025AIbase