C

Chattruth 7B

由mingdali開發
ChatTruth-7B是基於Qwen-VL架構優化的多語言視覺-語言模型,增強了大分辨率圖像處理能力並引入還原模塊降低計算開銷
下載量 73
發布時間 : 12/15/2023

模型概述

該模型專注於中文和英文的視覺-語言任務,通過創新架構提升高分辨率圖像處理效率,適用於圖文理解和生成任務

模型特點

大分辨率圖像處理
顯著提升了對高分辨率圖像的處理能力,優化視覺細節捕捉
還原模塊技術
創新性引入還原模塊,有效降低高分辨率圖像處理的計算開銷
雙語支持
同時支持中文和英文的視覺-語言任務處理

模型能力

圖像文字識別
圖文問答
多模態理解
高分辨率圖像處理

使用案例

文檔處理
圖像文字識別
從圖片中提取文字內容
示例輸出:昆明太厲害了
智能問答
圖文問答
基於圖片內容回答相關問題
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase