C

Colpali V1.1

vidoreによって開発
ColPaliはPaliGemma-3BとColBERT戦略に基づく視覚検索モデルで、視覚特徴から効率的に文書をインデックス化します。
ダウンロード数 196
リリース時間 : 8/21/2024

モデル概要

ColPaliは視覚言語モデル(VLM)で、テキストと画像のColBERTスタイルのマルチベクトル表現を生成し、主に文書検索タスクに使用されます。

モデル特徴

マルチベクトル表現
テキストと画像のColBERTスタイルのマルチベクトル表現を生成し、検索効率を向上させます。
視覚言語融合
SigLIPとPaliGemma-3Bの利点を組み合わせ、視覚と言語特徴の深い融合を実現します。
効率的な検索
ColBERT戦略によりテキストトークンと画像ブロック間の相互作用を計算し、検索性能を大幅に向上させます。

モデル能力

視覚文書検索
マルチモーダル表現学習
文書インデックス

使用事例

文書検索
学術文書検索
大量のPDF文書から関連情報を迅速に検索します。
ViDoReベンチマークで優れた性能を発揮
企業文書管理
企業内部文書を効率的に管理・検索します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase