Q

Qwen2.5 VL 7B Instruct GGUF

由Mungert開發
Qwen2.5-VL-7B-Instruct 是一個多模態視覺語言模型,支持圖像理解和文本生成任務。
下載量 17.10k
發布時間 : 3/27/2025

模型概述

該模型是基於Qwen2.5架構的多模態模型,能夠處理圖像和文本輸入,生成相應的文本輸出。適用於圖像描述、視覺問答等任務。

模型特點

多模態支持
能夠同時處理圖像和文本輸入,生成相應的文本輸出。
超低比特量化
採用IQ-DynamicGate技術,支持1-2比特量化,在保持高精度的同時顯著減少模型大小。
動態精度分配
通過分層策略,對不同層採用不同的量化精度,優化模型性能。

模型能力

圖像描述
視覺問答
多模態推理

使用案例

圖像理解
圖像描述生成
輸入一張圖片,模型生成對該圖片的詳細描述。
生成準確且詳細的圖像描述。
視覺問答
基於圖像的問答
輸入一張圖片和相關問題,模型生成答案。
生成與圖像內容相關的準確答案。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase