L

Llama 3.2 11B Vision Instruct Nf4

由SeanScripts開發
基於meta-llama/Llama-3.2-11B-Vision-Instruct的4位量化版本,支持圖像理解和文本生成任務
下載量 658
發布時間 : 9/25/2024

模型概述

這是一個多模態模型,能夠理解圖像內容並生成相關文本描述。通過NF4量化技術減小模型體積,適合在資源有限的環境中部署。

模型特點

4位量化技術
使用NF4量化技術將模型壓縮至4位精度,顯著減少內存佔用
多模態理解
能夠同時處理圖像和文本輸入,理解圖像內容並生成相關描述
高效推理
量化後的模型在保持較好性能的同時提高了推理速度

模型能力

圖像內容理解
圖像描述生成
多模態對話
視覺問答

使用案例

內容生成
自動圖像標註
為圖像生成描述性文本,可用於內容管理系統
生成準確、流暢的圖像描述
輔助工具
視障人士輔助
將圖像內容轉換為語音描述
幫助視障人士理解視覺內容
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase