C

Colqwen2 7b V1.0

由tsystems開發
基於Qwen2-VL-7B-Instruct並採用ColBERT策略的視覺檢索模型,專注於高效視覺特徵索引文檔
下載量 172
發布時間 : 12/30/2024

模型概述

ColQwen是基於視覺語言模型的新型架構,能生成ColBERT風格的多向量文本和圖像表示,用於高效文檔檢索

模型特點

動態圖像分辨率處理
接受動態分辨率輸入且不調整大小,保持原始寬高比,最多生成768個圖像塊
多向量表示
採用ColBERT風格的多向量文本和圖像表示,提升檢索效率
LoRA微調
使用低秩適配器(LoRA)進行高效微調,在語言模型Transformer層和投影層設置alpha=64和r=64

模型能力

視覺文檔檢索
多模態嵌入
跨模態匹配

使用案例

文檔檢索
PDF文檔檢索
從大量PDF文檔中快速檢索相關內容
實驗表明增加圖像塊數量能顯著提升效果
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase