C

Colsmolvlm V0.1

由vidore開發
基於SmolVLM-Instruct與ColBERT策略的視覺檢索模型,能高效通過視覺特徵索引文檔
下載量 1,353
發布時間 : 11/27/2024

模型概述

ColSmolVLM是一種基於視覺語言模型(VLM)的新型架構與訓練策略的模型,能生成文本和圖像的ColBERT風格多向量表示,用於高效文檔檢索

模型特點

ColBERT風格多向量表示
能生成文本和圖像的多向量表示,提高檢索效率
視覺文檔檢索
專門針對PDF類文檔優化的檢索能力
LoRA適配器
使用低秩適配器(LoRA)進行高效訓練

模型能力

視覺文檔檢索
多模態表示學習
跨模態匹配

使用案例

文檔檢索
學術文獻檢索
通過視覺特徵檢索學術PDF文檔
企業文檔管理
高效索引和管理大量PDF文檔
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase