C

Colqwen2.5 3b Multilingual

由Metric-AI開發
基於Qwen2.5-VL-3B-Instruct的多語言視覺檢索器,採用ColBERT策略,在Vidore基準測試中表現優異
下載量 1,957
發布時間 : 2/1/2025

模型概述

ColQwen是一種基於視覺語言模型(VLM)的新型架構和訓練策略的模型,能高效地從視覺特徵索引文檔。支持多語言和多模態嵌入,適用於文本到視覺文檔檢索任務。

模型特點

多語言支持
支持英語、法語、西班牙語、意大利語和德語等多種語言的視覺文檔檢索
動態輸入分辨率
支持動態輸入圖像分辨率且不改變原始寬高比,最大分辨率限制為最多生成768個圖像塊
高效檢索
採用ColBERT策略,生成多向量文本和圖像表示,提高檢索效率
高性能
在Vidore基準測試中,7B參數以下模型中排名第一,整體排名第三

模型能力

多模態嵌入
多語言嵌入
文本到視覺文檔檢索
高效文檔索引

使用案例

文檔檢索
多語言文檔檢索
從多語言文檔中檢索相關內容
高效準確地檢索多語言文檔
視覺文檔檢索
從視覺文檔中檢索相關內容
支持動態輸入分辨率,提高檢索效率
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase