Q

Qwen2.5 VL 7B Instruct GGUF

Developed by Mungert
Qwen2.5-VL-7B-Instruct 是一個多模態視覺語言模型,支持圖像理解和文本生成任務。
Downloads 17.10k
Release Time : 3/27/2025

Model Overview

該模型是基於Qwen2.5架構的多模態模型,能夠處理圖像和文本輸入,生成相應的文本輸出。適用於圖像描述、視覺問答等任務。

Model Features

多模態支持
能夠同時處理圖像和文本輸入,生成相應的文本輸出。
超低比特量化
採用IQ-DynamicGate技術,支持1-2比特量化,在保持高精度的同時顯著減少模型大小。
動態精度分配
通過分層策略,對不同層採用不同的量化精度,優化模型性能。

Model Capabilities

圖像描述
視覺問答
多模態推理

Use Cases

圖像理解
圖像描述生成
輸入一張圖片,模型生成對該圖片的詳細描述。
生成準確且詳細的圖像描述。
視覺問答
基於圖像的問答
輸入一張圖片和相關問題,模型生成答案。
生成與圖像內容相關的準確答案。
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase