C

Colpali V1.1

由vidore開發
ColPali是基於PaliGemma-3B與ColBERT策略的視覺檢索模型,用於高效地從視覺特徵中索引文檔。
下載量 196
發布時間 : 8/21/2024

模型概述

ColPali是一種視覺語言模型(VLM),能夠生成文本和圖像的ColBERT風格多向量表示,主要用於文檔檢索任務。

模型特點

多向量表示
生成文本和圖像的ColBERT風格多向量表示,提高檢索效率。
視覺語言融合
結合SigLIP和PaliGemma-3B的優勢,實現視覺與語言特徵的深度融合。
高效檢索
通過ColBERT策略計算文本標記與圖像塊之間的交互,顯著提升檢索性能。

模型能力

視覺文檔檢索
多模態表示學習
文檔索引

使用案例

文檔檢索
學術文檔檢索
從大量PDF文檔中快速檢索相關信息。
在ViDoRe基準測試中表現優異
企業文檔管理
高效管理和檢索企業內部文檔。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase