S

Stella Pl Retrieval

sdadasによって開発
これはstella_en_1.5B_v5をベースにポーランド語情報検索タスク向けにさらにファインチューニングされたテキストエンコーダで、ポーランド語情報検索タスクに特化して最適化されています。
ダウンロード数 913
リリース時間 : 9/28/2024

モデル概要

このモデルは多言語知識蒸留法でポーランド語に適応され、対照損失を用いてファインチューニングされ、テキストを1024次元ベクトルに変換します。特にポーランド語情報検索タスクに適しています。

モデル特徴

ポーランド語最適化
ポーランド語情報検索タスク向けに特化して最適化され、多言語知識蒸留と対照損失ファインチューニングを採用しています。
効率的な検索
1024次元ベクトルでテキストを表現し、効率的な情報検索タスクをサポートします。
大規模トレーニング
2000万のポーランド語-英語テキストペアで知識蒸留を行い、140万件のクエリデータでファインチューニングしました。

モデル能力

テキストエンコーディング
情報検索
文類似度計算

使用事例

情報検索
ポーランド語ドキュメント検索
ポーランド語ドキュメントライブラリから関連ドキュメントを検索
ポーランド情報検索ベンチマークテストでNDCG@10スコア62.32を達成
意味解析
ポーランド語意味類似度計算
ポーランド語テキスト間の意味的類似度を計算
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase