D

Devstral Small Vision 2505 GGUF

由ngxson開發
基於Mistral Small模型的視覺編碼器,支持圖像文本生成任務,適配llama.cpp框架
下載量 777
發布時間 : 5/21/2025

模型概述

一個結合視覺編碼能力的語言模型,能夠處理圖像輸入並生成相關文本描述

模型特點

視覺編碼能力
集成Mistral Small的視覺編碼器,支持圖像理解
llama.cpp兼容
專為llama.cpp框架優化,可無縫部署
多模態處理
能夠同時處理視覺和文本輸入,生成連貫輸出

模型能力

圖像理解
文本生成
多模態推理

使用案例

內容生成
圖像描述生成
根據輸入圖像自動生成描述性文本
如示例所示,能準確描述圖像內容和場景
輔助工具
視覺問答
基於圖像內容回答用戶問題
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase