Q

Qwen2.5 VL 72B Instruct GGUF

由Mungert開發
Qwen2.5-VL-72B-Instruct是一個72B參數規模的多模態大模型,支持視覺-語言任務,能夠理解和生成與圖像相關的文本內容。
下載量 2,798
發布時間 : 3/29/2025

模型概述

該模型是一個視覺-語言模型,能夠處理圖像和文本輸入,執行多模態理解和生成任務。

模型特點

多模態理解
能夠同時處理圖像和文本輸入,理解兩者之間的關係
大參數規模
72B參數規模提供強大的理解和生成能力
指令跟隨
支持指令跟隨,能夠根據用戶指令執行特定任務

模型能力

圖像理解
文本生成
視覺問答
圖像描述生成
多模態推理

使用案例

內容生成
圖像描述生成
為輸入圖像生成詳細的文字描述
生成準確、豐富的圖像描述
智能助手
視覺問答
回答關於圖像內容的各類問題
提供準確、相關的答案
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase