llama-3.2-11B-Vision-Medical開源醫療視覺模型

首頁

Llama 3.2 11B Vision Medical

由Varu96開發

基於unsloth/Llama-3.2-11B-Vision-Instruct微調的模型，使用Unsloth和Huggingface的TRL庫進行訓練，速度提升了2倍。

文本生成圖像

Transformers

英語開源協議:Apache-2.0 #視覺指令微調 #高效訓練加速 #多模態推理

下載量 25

發布時間 : 3/10/2025

模型概述

這是一個結合視覺和文本指令的多模態模型，能夠處理視覺和文本輸入，生成相應的文本輸出。

模型特點

高效訓練

使用Unsloth和Huggingface的TRL庫進行訓練，速度提升了2倍。

多模態支持

能夠處理視覺和文本輸入，生成相應的文本輸出。

開源許可

採用Apache-2.0許可證，允許商業和研究使用。

模型能力

文本生成

視覺理解

多模態推理

使用案例

教育

視覺問答

根據提供的圖像和問題，生成準確的答案。

提升學習效率和互動性。

內容創作

圖文生成

根據圖像生成描述性文本或故事。

豐富內容創作的多樣性。

屬性	詳情
模型開發者	Varu96
許可證	apache - 2.0
微調基礎模型	unsloth/Llama-3.2-11B-Vision-Instruct

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

智啟未來，您的人工智能解決方案智庫

Llama 3.2 11B Vision Medical

模型概述

模型特點

模型能力

使用案例

🚀 上傳的微調模型

🚀 快速開始

模型信息

訓練情況

標籤信息