Q

Qwen2 VL 2B Instruct GGUF

由second-state開發
Qwen2-VL-2B-Instruct 是一個多模態視覺語言模型,支持圖像文本生成任務,基於 Qwen2 架構,參數規模為 2B。
下載量 125
發布時間 : 12/15/2024

模型概述

該模型是一個多模態視覺語言模型,能夠處理圖像和文本輸入,生成相關的文本輸出。適用於需要結合視覺和語言理解的應用場景。

模型特點

多模態支持
能夠同時處理圖像和文本輸入,生成相關的文本輸出。
高效量化
提供多種量化版本的模型,適用於不同硬件和性能需求。
長上下文支持
支持長達 32000 的上下文長度,適合處理複雜任務。

模型能力

圖像文本生成
多模態理解
視覺問答

使用案例

視覺問答
圖像描述生成
根據輸入的圖像生成詳細的文本描述。
視覺問答
回答關於輸入圖像的問題。
多模態交互
圖像與文本結合的任務
結合圖像和文本輸入,生成相關的文本輸出。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase