C

Colqwen2.5 3b Multilingual V1.0 Merged

Developed by tsystems
基於Qwen2.5-VL-3B-Instruct與ColBERT策略的多語言視覺檢索模型,支持動態輸入圖像分辨率,生成ColBERT風格的多向量文本與圖像表徵。
Downloads 70
Release Time : 3/9/2025

Model Overview

該模型是一種基於視覺語言模型(VLMs)的新型架構與訓練策略的模型,能高效通過視覺特徵索引文檔,支持多語言和多模態嵌入。

Model Features

多語言支持
支持英語、法語、西班牙語、意大利語和德語等多種語言的視覺文檔檢索
動態圖像分辨率
支持動態輸入圖像分辨率且不改變寬高比,最大分辨率設定為最多生成768個圖像塊
高效檢索
採用ColBERT風格的多向量表徵,實現高效的文檔檢索
多模態嵌入
支持文本和圖像的聯合嵌入,實現跨模態檢索

Model Capabilities

多語言視覺文檔檢索
文本到圖像檢索
多模態嵌入
動態圖像處理

Use Cases

文檔檢索
多語言PDF文檔檢索
在多語言PDF文檔中根據文本查詢檢索相關圖像或文檔片段
高效檢索相關文檔內容,支持多種語言
視覺問答系統
在視覺問答系統中根據問題檢索相關圖像或文檔內容
提升問答系統的準確性和效率
跨模態檢索
文本到圖像檢索
根據文本描述檢索相關圖像
實現高效的跨模態檢索
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase