C

Colqwen2.5 3b Multilingual V1.0 Merged

由tsystems開發
基於Qwen2.5-VL-3B-Instruct與ColBERT策略的多語言視覺檢索模型,支持動態輸入圖像分辨率,生成ColBERT風格的多向量文本與圖像表徵。
下載量 70
發布時間 : 3/9/2025

模型概述

該模型是一種基於視覺語言模型(VLMs)的新型架構與訓練策略的模型,能高效通過視覺特徵索引文檔,支持多語言和多模態嵌入。

模型特點

多語言支持
支持英語、法語、西班牙語、意大利語和德語等多種語言的視覺文檔檢索
動態圖像分辨率
支持動態輸入圖像分辨率且不改變寬高比,最大分辨率設定為最多生成768個圖像塊
高效檢索
採用ColBERT風格的多向量表徵,實現高效的文檔檢索
多模態嵌入
支持文本和圖像的聯合嵌入,實現跨模態檢索

模型能力

多語言視覺文檔檢索
文本到圖像檢索
多模態嵌入
動態圖像處理

使用案例

文檔檢索
多語言PDF文檔檢索
在多語言PDF文檔中根據文本查詢檢索相關圖像或文檔片段
高效檢索相關文檔內容,支持多種語言
視覺問答系統
在視覺問答系統中根據問題檢索相關圖像或文檔內容
提升問答系統的準確性和效率
跨模態檢索
文本到圖像檢索
根據文本描述檢索相關圖像
實現高效的跨模態檢索
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase