C

Colqwen2.5 V0.2

由vidore開發
ColQwen2.5是基於Qwen2.5-VL-3B-Instruct與ColBERT策略的視覺檢索模型,專注於通過視覺特徵高效索引文檔。
下載量 22.31k
發布時間 : 1/31/2025

模型概述

ColQwen2.5是一種視覺語言模型(VLM),能夠生成文本和圖像的ColBERT風格多向量表示,用於高效文檔檢索。

模型特點

動態輸入圖像分辨率
支持動態輸入圖像分辨率且不進行尺寸調整,保持相同寬高比處理。
多向量表示
生成文本和圖像的ColBERT風格多向量表示,提升檢索效率。
高分辨率處理
最大分辨率設定為最多生成768個圖像塊,增加圖像塊數量可顯著提升效果。

模型能力

視覺文檔檢索
多向量表示生成
動態圖像處理

使用案例

文檔檢索
學術文檔檢索
用於檢索學術論文中的相關內容。
PDF文檔檢索
用於檢索PDF文檔中的視覺和文本信息。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase