Q

Qwen2.5 Vl Vqa Vibook

由sunbv56開發
基於Qwen2.5架構的視覺問答模型,專注于越南語場景,支持對圖像相關問題進行解答。
下載量 148
發布時間 : 6/18/2025

模型概述

該模型是一個視覺問答模型,結合了視覺和語言處理能力,能夠理解圖像內容並回答相關問題,特別針對越南語場景優化。

模型特點

越南語支持
專門針對越南語場景優化,能夠處理越南語的視覺問答任務。
多模態能力
結合視覺和語言處理能力,能夠理解圖像內容並生成相關回答。
輕量級模型
3B參數的規模,適合在資源有限的環境中部署。

模型能力

圖像理解
越南語問答
多模態推理

使用案例

教育
越南語學習輔助
幫助學生通過圖像理解越南語詞彙和場景。
客戶服務
自動化客服
通過圖像回答客戶關於產品的問題。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase