Q

Qwen2.5 VL 3B Instruct GGUF

由Mungert開發
Qwen2.5-VL-3B-Instruct是一個3B參數規模的多模態模型,支持圖文生成任務,特別優化了在llama.cpp中的視覺功能支持。
下載量 10.44k
發布時間 : 3/27/2025

模型概述

該模型是一個結合視覺和語言能力的多模態模型,能夠理解和生成與圖像相關的文本內容。

模型特點

多模態支持
同時處理視覺和語言信息,實現圖文交互
llama.cpp優化
特別適配llama.cpp分叉版本,支持視覺功能
超低位量化
支持IQ-DynamicGate超低位量化(1-2位),在保持性能的同時減少模型大小

模型能力

圖像描述生成
視覺問答
多模態推理

使用案例

內容生成
圖像描述
為輸入的圖像生成詳細描述
生成符合圖像內容的自然語言描述
視覺輔助
視覺問答
回答關於圖像內容的問題
提供與圖像相關的準確答案
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase