C

Colbertv2 Camembert L4 Mmarcofr

antoinelouisによって開発
軽量ColBERTv2モデルで、フランス語の意味検索に特化して設計され、効率的なコンテキストマッチング検索をサポートします。
ダウンロード数 533
リリース時間 : 3/11/2024

モデル概要

このモデルはColBERTv2アーキテクチャに基づいており、フランス語の意味検索に最適化されています。クエリとテキスト段落をトークンレベルの埋め込み行列にエンコードし、MaxSim演算子を通じて効率的なマッチングを実現します。

モデル特徴

軽量設計
パラメータ数はわずか54Mで、モデルサイズは0.2GBで、リソースが限られた環境でのデプロイに適しています。
効率的な検索
MaxSim演算子を使用して効率的なコンテキストマッチング検索を実現し、大規模コーパスの検索をサポートします。
フランス語最適化
フランス語の意味検索に特化してトレーニングと最適化が行われ、mMARCO-frデータセットで優れた性能を発揮します。
残差圧縮
ColBERTv2の残差圧縮メカニズムを採用し、インデックスのストレージ容量の要件を大幅に削減します。

モデル能力

フランス語の意味検索
コンテキストマッチング検索
大規模コーパスのインデックス化

使用事例

情報検索
文書検索システム
フランス語の文書検索システムを構築し、クエリの意味にマッチする文書を迅速に見つけます。
mMARCO-frデータセットで@1000のリコール率が91.9%に達します
質問応答システム
質問応答システムの検索コンポーネントとして、質問に関連する候補段落を迅速に見つけます。
@10のMRRが32.3に達します
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase