C

Colqwen2.5 3b Multilingual V1.0

Developed by tsystems
基於Qwen2.5-VL-3B-Instruct與ColBERT策略的多語言視覺檢索模型,支持動態輸入圖像分辨率和多語言文檔檢索。
Downloads 13.29k
Release Time : 3/9/2025

Model Overview

ColQwen是一種新型視覺語言模型架構,能高效通過視覺特徵索引文檔,生成ColBERT風格的多向量文本與圖像表徵,適用於多語言視覺文檔檢索任務。

Model Features

多語言支持
支持英語、法語、西班牙語、意大利語和德語五種語言的視覺文檔檢索
動態圖像分辨率
支持不改變寬高比的動態輸入圖像分辨率,最大限制為768個圖像塊
高效檢索架構
採用ColBERT風格的多向量表徵策略,提高文檔檢索效率
多模態嵌入
同時處理文本和圖像輸入,生成聯合的多模態嵌入

Model Capabilities

多語言視覺文檔檢索
文本到圖像檢索
多模態嵌入生成
動態分辨率圖像處理

Use Cases

文檔檢索
多語言PDF文檔檢索
根據文本查詢在多語言PDF文檔庫中檢索相關文檔
可高效檢索包含視覺內容的文檔
視覺問答系統
基於文檔圖像內容回答用戶問題
結合文本和視覺信息提供準確答案
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase