P

Polish Reranker Large Ranknet

sdadasによって開発
これはRankNet損失関数でトレーニングされたポーランド語テキストランキングモデルで、140万件のクエリと1000万件のドキュメントからなるテキストペアで構成されたデータセットでトレーニングされています。
ダウンロード数 337
リリース時間 : 2/3/2024

モデル概要

このモデルは主にポーランド語テキストのランキングと再ランキングタスクに使用され、クエリとドキュメントの関連性を評価してランキングを行うことができます。

モデル特徴

効率的なトレーニング方法
RankNet損失関数を使用してトレーニングされ、クエリとドキュメントペアに基づいて損失を計算し、独立したクエリ-ドキュメントペア処理を行いません
優れたパフォーマンス
ポーランド情報検索ベンチマークで教師モデルを上回る性能を発揮し、パラメータ数は教師モデルの1/30でありながら、推論速度は33倍高速です
多様なトレーニングデータ
トレーニングデータにはポーランド語MS MARCOトレーニングセット、ポーランド語に翻訳されたELI5データセット、ポーランド語医療QAセットが含まれています

モデル能力

テキスト関連性評価
クエリ-ドキュメントランキング
情報検索結果再ランキング

使用事例

情報検索
検索エンジン結果最適化
検索エンジンが返す結果を再ランキングし、最も関連性の高い結果の順位を向上させます
ポーランド情報検索ベンチマークでNDCG@10が62.65を達成
質問応答システム
QA関連性ランキング
QAシステムが返す複数の回答を関連性でランキングします
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase