C

Colqwen2.5 3b Multilingual V1.0

由tsystems開發
基於Qwen2.5-VL-3B-Instruct與ColBERT策略的多語言視覺檢索模型,支持動態輸入圖像分辨率和多語言文檔檢索。
下載量 13.29k
發布時間 : 3/9/2025

模型概述

ColQwen是一種新型視覺語言模型架構,能高效通過視覺特徵索引文檔,生成ColBERT風格的多向量文本與圖像表徵,適用於多語言視覺文檔檢索任務。

模型特點

多語言支持
支持英語、法語、西班牙語、意大利語和德語五種語言的視覺文檔檢索
動態圖像分辨率
支持不改變寬高比的動態輸入圖像分辨率,最大限制為768個圖像塊
高效檢索架構
採用ColBERT風格的多向量表徵策略,提高文檔檢索效率
多模態嵌入
同時處理文本和圖像輸入,生成聯合的多模態嵌入

模型能力

多語言視覺文檔檢索
文本到圖像檢索
多模態嵌入生成
動態分辨率圖像處理

使用案例

文檔檢索
多語言PDF文檔檢索
根據文本查詢在多語言PDF文檔庫中檢索相關文檔
可高效檢索包含視覺內容的文檔
視覺問答系統
基於文檔圖像內容回答用戶問題
結合文本和視覺信息提供準確答案
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase