M

Mmlw Retrieval Roberta Base

sdadasによって開発
MMLW(私はより良いニュースを得なければならない)はポーランド語のニューラルテキストエンコーダーで、情報検索タスクに最適化されており、クエリと段落を768次元ベクトルに変換できます。
ダウンロード数 408
リリース時間 : 10/18/2023

モデル概要

このモデルはポーランド語のセンテンストランスフォーマーで、主に特徴抽出と文の類似度計算に使用され、特に情報検索タスクに適しています。

モデル特徴

多言語知識蒸留
6000万のポーランド語-英語テキストペアで多言語知識蒸留方法を使用して訓練され、英語のFlagEmbeddings(BGE)を教師モデルとして使用しています。
対照損失ファインチューニング
ポーランドのMS MARCOトレーニングセットで対照損失を使用してファインチューニングを行い、大規模バッチサイズでトレーニング効率を向上させています。
特定のプレフィックス要件
テキストをエンコードする際には特定のプレフィックスとサフィックスを使用する必要があり、クエリは'クエリ: 'プレフィックスで始める必要があります。

モデル能力

テキストエンコーディング
文の類似度計算
情報検索

使用事例

情報検索
健康情報検索
健康関連のクエリに基づいて最も関連性の高い回答を検索
健康的な食事アドバイスを正確にマッチングできる
政治情報検索
政治的約束に関連する情報を検索
政治関連のテキストを識別できる
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase