C

Colpali V1.3 Hf

由vidore開發
ColPali是一種基於PaliGemma-3B擴展的視覺語言模型,能高效通過視覺特徵索引文檔,生成ColBERT式多向量表示。
下載量 790
發布時間 : 11/28/2024

模型概述

該模型通過視覺特徵索引文檔,結合PaliGemma-3B的視覺語言能力和ColBERT的多向量表示策略,實現高效的文檔檢索。

模型特點

多向量表示
採用ColBERT策略生成文本與圖像的多向量表示,提高檢索精度
視覺語言融合
結合PaliGemma-3B的視覺語言能力,實現跨模態理解
高效檢索
通過視覺特徵索引文檔,優化檢索效率

模型能力

視覺文檔檢索
跨模態理解
多向量表示生成

使用案例

文檔檢索
PDF文檔檢索
通過視覺特徵快速檢索PDF文檔中的相關內容
跨模態搜索
圖文關聯搜索
根據文本查詢檢索相關圖像內容,或根據圖像檢索相關文本
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase