C

Colsmol 256M

由vidore開發
基於SmolVLM-Instruct-250M並採用ColBERT策略的視覺檢索器,能高效地從視覺特徵索引文檔
下載量 42.84k
發布時間 : 1/22/2025

模型概述

ColSmolVLM是一種基於新型模型架構和訓練策略的視覺語言模型(VLM),能生成文本和圖像的ColBERT風格多向量表示,用於高效文檔檢索

模型特點

ColBERT風格多向量表示
能生成文本和圖像的多向量表示,提高檢索效率
高效視覺文檔檢索
專門優化用於從視覺特徵索引文檔的任務
LoRA適配器訓練
使用低秩適配器(LoRA)進行訓練,參數效率高

模型能力

視覺文檔檢索
多模態表示學習
跨模態匹配

使用案例

文檔檢索
學術文獻檢索
從大量PDF文檔中檢索相關學術文獻
企業文檔管理
幫助企業管理內部文檔庫,快速找到所需信息
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase