llama_3.2-vision_instruct_bpmncoder開源模型 - 免費部署，實現視覺指令高效處理與快速訓練

Llama 3.2 Vision Instruct Bpmncoder

由utkarshkingh開發

基於Unsloth優化的Llama 3.2 11B視覺指令微調模型，採用4位量化技術，訓練速度提升2倍

下載量 40

發布時間 : 3/23/2025

模型概述

這是一個經過微調的多模態語言模型，支持視覺和文本指令理解與生成，適用於多模態交互場景

高效訓練優化

使用Unsloth框架優化，訓練速度提升2倍

4位量化技術

採用BNB 4位量化，降低顯存需求

多模態支持

支持視覺和文本指令的理解與生成

多模態指令理解

文本生成

視覺內容分析

推理任務處理

智能助手

多模態對話系統

處理包含圖像和文本的複雜用戶查詢

提供結合視覺和文本信息的綜合回答

內容生成

圖文內容創作

根據視覺輸入生成相關文本描述

自動生成高質量的圖文匹配內容

屬性	詳情
基礎模型	unsloth/llama-3.2-11b-vision-instruct-unsloth-bnb-4bit
標籤	text-generation-inference、transformers、unsloth、mllama
開發者	utkarshkingh
許可證	apache-2.0
微調來源模型	unsloth/llama-3.2-11b-vision-instruct-unsloth-bnb-4bit