M

Modernbert Base ColBERT

Y-J-Juによって開発
これはanswerdotai/ModernBERT-baseをMS-MARCOデータセットでファインチューニングしたPyLateモデルで、文の類似度計算とドキュメント検索に使用されます。
ダウンロード数 88
リリース時間 : 1/3/2025

モデル概要

このモデルは文と段落を128次元の高密度ベクトルシーケンスにマッピングし、MaxSim演算子を使用して意味的テキスト類似度を計算します。情報検索と再ランキングタスクに適しています。

モデル特徴

効率的な検索
Voyager HNSWインデックスを利用した高速ドキュメント検索
マルチベクトル表現
単一ベクトルではなく128次元の高密度ベクトルシーケンスを生成し、より多くの意味情報を保持
蒸留訓練
蒸留損失関数を使用した訓練でモデル性能を向上

モデル能力

意味的類似度計算
ドキュメント検索
クエリ再ランキング
特徴抽出

使用事例

情報検索
ドキュメント検索
ドキュメントコレクションからクエリに最も関連するドキュメントを検索
MS-MARCOなどの標準検索データセットで良好なパフォーマンス
検索結果の再ランキング
初期検索結果を詳細にランキング
検索システムの精度と関連性を向上可能
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase