C

Colqwen2 V1.0

由vidore開發
ColQwen2是基於Qwen2-VL-2B-Instruct與ColBERT策略的視覺檢索模型,用於高效索引文檔的視覺特徵。
下載量 106.85k
發布時間 : 11/3/2024

模型概述

ColQwen2是一種視覺語言模型(VLM),能夠生成文本和圖像的ColBERT風格多向量表示,主要用於文檔檢索任務。

模型特點

動態輸入圖像分辨率
支持不調整尺寸的原始寬高比輸入,最大分辨率設定為最多生成768個圖像塊
多向量表示
採用ColBERT風格的多向量表示方法,提高檢索效率
LoRA適配器
在語言模型的Transformer層和投影層應用低秩適配器(LoRA),參數為alpha=32和r=32

模型能力

視覺文檔檢索
多模態表示學習
跨模態檢索

使用案例

文檔檢索
學術文獻檢索
從大量PDF文檔中檢索相關學術文獻
顯著提升檢索效率
企業文檔管理
企業內部文檔的高效索引和檢索
提高文檔查找效率
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase