C

Colqwen2 7b V1.0

由yydxlv開發
基於Qwen2-VL-7B-Instruct與ColBERT策略的視覺檢索模型,支持多向量文本與圖像表示
下載量 25
發布時間 : 12/24/2024

模型概述

ColQwen是一種新型視覺語言模型架構,通過視覺特徵高效索引文檔,特別適用於PDF類文檔檢索

模型特點

動態圖像分辨率支持
支持不調整寬高比的動態輸入圖像分辨率,最大可生成768個圖像塊
多向量表示
採用ColBERT風格的多向量文本與圖像表示,提高檢索效率
高效訓練策略
使用LoRA適配器訓練,優化計算資源使用

模型能力

視覺文檔檢索
多模態嵌入
圖像特徵提取
文本特徵提取

使用案例

文檔檢索
PDF文檔檢索
基於視覺特徵的PDF文檔內容檢索
提高文檔檢索效率
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase