C

Colsmol 500M

由vidore開發
基於SmolVLM-Instruct-500M與ColBERT策略的視覺檢索模型,能高效通過視覺特徵索引文檔
下載量 1,807
發布時間 : 1/22/2025

模型概述

ColSmolVLM是一種基於視覺語言模型(VLMs)的新型架構和訓練策略,能生成文本和圖像的ColBERT式多向量表示,用於高效文檔檢索

模型特點

ColBERT式多向量表示
能生成文本和圖像的多向量表示,提高檢索效率
高效視覺特徵索引
通過視覺特徵高效索引文檔內容
LoRA適配器訓練
在語言模型的Transformer層和投影層應用LoRA適配器進行訓練

模型能力

視覺文檔檢索
多向量表示生成
圖像-文本匹配

使用案例

文檔檢索
學術文獻檢索
通過視覺特徵檢索PDF文檔中的相關內容
企業文檔管理
快速定位公司內部文檔中的相關信息
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase