C

Colpali

由vidore開發
ColPali是基於PaliGemma-3B與ColBERT策略的視覺檢索模型,用於高效地從視覺特徵索引文檔。
下載量 12.88k
發布時間 : 6/25/2024

模型概述

ColPali是一種視覺語言模型(VLM),能夠生成ColBERT風格的多向量文本和圖像表示,用於文檔檢索任務。

模型特點

多向量表示
採用ColBERT策略生成文本和圖像的多向量表示,提高檢索效率
視覺語言融合
結合SigLIP視覺模型和PaliGemma語言模型,實現跨模態理解
高效檢索
通過延遲交互機制計算文本標記與圖像塊之間的交互作用,提升檢索性能

模型能力

視覺文檔檢索
跨模態理解
多向量表示生成

使用案例

文檔檢索
學術文獻檢索
從PDF文檔中檢索相關信息
相比BiPali實現性能的階躍式提升
企業文檔管理
從大量文檔中快速定位相關內容
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase