C

Colbert ModernBERT Base Turkish Uncased

99eren99によって開発
これはPyLateを使用してModernBERT-base-Turkish-uncased-mlmから微調整されたトルコ語モデルで、文の類似性計算と文書の再ランキングに使用されます。
ダウンロード数 74
リリース時間 : 2/14/2025

モデル概要

このモデルは文と段落を128次元の密ベクトルシーケンスにマッピングし、MaxSim演算子を使用した意味的テキスト類似性計算をサポートし、トルコ語テキスト検索と再ランキングタスクに適しています。

モデル特徴

長文脈処理
最大8192トークンの文書処理をサポートし、長文検索シナリオに適しています
効率的な検索
Voyager HNSWインデックスを利用した高速文書検索を実現
マルチグレイン表現
128次元の密ベクトルシーケンスを生成し、テキストの細かい意味情報を保持します

モデル能力

意味的テキスト類似性計算
文書検索
クエリ-文書マッチング
検索結果再ランキング

使用事例

情報検索
文書検索エンジン
トルコ語文書検索エンジンを構築し、検索結果の関連性を向上
nDCGと再現率指標の向上
質問応答システム
質問応答システムでの回答候補の再ランキングに使用
回答精度の向上
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase