C

Colpali V1.1

Developed by vidore
ColPaliはPaliGemma-3BとColBERT戦略に基づく視覚検索モデルで、視覚特徴から効率的に文書をインデックス化します。
Downloads 196
Release Time : 8/21/2024

Model Overview

ColPaliは視覚言語モデル(VLM)で、テキストと画像のColBERTスタイルのマルチベクトル表現を生成し、主に文書検索タスクに使用されます。

Model Features

マルチベクトル表現
テキストと画像のColBERTスタイルのマルチベクトル表現を生成し、検索効率を向上させます。
視覚言語融合
SigLIPとPaliGemma-3Bの利点を組み合わせ、視覚と言語特徴の深い融合を実現します。
効率的な検索
ColBERT戦略によりテキストトークンと画像ブロック間の相互作用を計算し、検索性能を大幅に向上させます。

Model Capabilities

視覚文書検索
マルチモーダル表現学習
文書インデックス

Use Cases

文書検索
学術文書検索
大量のPDF文書から関連情報を迅速に検索します。
ViDoReベンチマークで優れた性能を発揮
企業文書管理
企業内部文書を効率的に管理・検索します。
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase