L

Llama 3.2 Vision Instruct Bpmncoder

由utkarshkingh開發
基於Unsloth優化的Llama 3.2 11B視覺指令微調模型,採用4位量化技術,訓練速度提升2倍
下載量 40
發布時間 : 3/23/2025

模型概述

這是一個經過微調的多模態語言模型,支持視覺和文本指令理解與生成,適用於多模態交互場景

模型特點

高效訓練優化
使用Unsloth框架優化,訓練速度提升2倍
4位量化技術
採用BNB 4位量化,降低顯存需求
多模態支持
支持視覺和文本指令的理解與生成

模型能力

多模態指令理解
文本生成
視覺內容分析
推理任務處理

使用案例

智能助手
多模態對話系統
處理包含圖像和文本的複雜用戶查詢
提供結合視覺和文本信息的綜合回答
內容生成
圖文內容創作
根據視覺輸入生成相關文本描述
自動生成高質量的圖文匹配內容
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase