Qwen2.5 VL 32B Instruct GGUF
Qwen2.5 VL 32B Instruct是由Qwen開發的多模態大語言模型,支持視覺和語言任務,具備強大的圖像理解和文本生成能力。
下載量 3,713
發布時間 : 3/27/2025
模型概述
該模型擅長識別常見物體(如花卉、鳥類、魚類、昆蟲),並能高效分析圖像中的文本、圖表、圖標、圖形和佈局。可作為視覺代理,具備動態推理和工具調用能力,支持計算機和手機操作。適用於生成結構化輸出和穩定的JSON格式結果,支持多語言。
模型特點
多模態能力
支持視覺和語言任務,能夠同時處理圖像和文本輸入。
長上下文支持
支持128k tokens的上下文長度,適合處理長文檔或複雜任務。
結構化輸出
能夠生成穩定的JSON格式結果,適合需要結構化數據的應用場景。
動態推理與工具調用
可作為視覺代理,支持動態推理和工具調用,適用於計算機和手機操作。
模型能力
文本生成
圖像分析
圖表識別
佈局分析
多語言支持
結構化輸出生成
動態推理
工具調用
使用案例
視覺輔助
圖像內容描述
分析圖像內容並生成詳細的文字描述。
準確識別圖像中的物體、場景和文本。
圖表解析
解析圖像中的圖表、圖形和數據。
提取圖表中的關鍵信息並生成結構化數據。
自動化工具
計算機操作代理
作為視覺代理執行計算機操作任務。
通過圖像識別和工具調用完成自動化任務。
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98