多模態醫學分析

# 多模態醫學分析

Medgemma 4b It 8bit

MedGemma-4B-IT-8bit是Google MedGemma模型的MLX格式轉換版本，專注於醫療領域的視覺語言任務。

圖像生成文本

MedGemma是Google開發的醫療專用多模態AI模型，基於Gemma 3架構，專注於醫學文本和圖像理解。

圖像生成文本

MedGemma是基於Gemma 3優化的醫學多模態模型系列，專為醫學文本和圖像理解設計，提供4B和27B兩種參數規模版本。

圖像生成文本

Llama 3.2 11B Vision Radiology Mini

基於unsloth/Llama-3.2-11B-Vision-Instruct微調的放射影像輔助解讀模型，優化後運行速度提升兩倍

圖像生成文本

Transformers 英語

Chinese LLaVA Med 7B

基於LLaVA-1.5架構的中文醫療多模態大語言模型，專注於醫療領域的視覺問答任務。

文本生成圖像

Transformers 中文

RadLLaMA-7b是斯坦福AIMI團隊開發的針對放射學領域的基礎語言模型，基於LLaMA2架構。

大型語言模型

Llava Roco 8bit

BabyDoctor是一個多模態大語言模型，融合了CLiP和LLaMA 2的能力，能夠理解和生成文本，同時理解圖像。該模型經過微調，專門用於解讀X光、超聲波、核磁共振和CT掃描等放射學圖像。

圖像生成文本

Transformers 英語

RCLIP是基於CLIP模型在放射影像領域微調的視覺-語言模型，專為醫學影像分析優化。

文本生成圖像

Transformers 英語

Quiltnet B 16 PMB

基於Quilt-1M病理視頻數據集訓練的ViT-B/16視覺編碼器與PubMedBERT文本編碼器多模態基礎模型

圖像生成文本

基於Quilt-1M病理視頻數據集訓練的CLIP ViT-B/32視覺語言基礎模型，專為病理組織學分析設計

文本生成圖像

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

大型語言模型

Transformers 支持多種語言

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Transformers 英語

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

問答系統中文

AIbase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

© 2025AIbase