M

Mmlw Roberta Base

Developed by sdadas
RoBERTaアーキテクチャに基づくポーランド語文埋め込みモデルで、文類似度計算と特徴抽出タスクに特化しています。
Downloads 106.30k
Release Time : 11/17/2023

Model Overview

このモデルはRoBERTaアーキテクチャに基づくポーランド語事前学習モデルで、主に文類似度計算、特徴抽出、関連する自然言語処理タスクに使用されます。MTEB(Massive Text Embedding Benchmark)ポーランド語ベンチマークテストで多様な能力を示しました。

Model Features

ポーランド語最適化
ポーランド語テキストに特化して最適化されており、ポーランド語NLPタスクで優れた性能を発揮します。
多機能文埋め込み
高品質な文埋め込み表現を生成でき、多様な下流タスクに適用可能です。
MTEBベンチマークテスト検証
複数のMTEBポーランド語ベンチマークテストタスクで包括的な評価を受けています。

Model Capabilities

文類似度計算
テキスト特徴抽出
テキストクラスタリング
テキスト分類
情報検索
意味的テキスト類似度評価

Use Cases

テキスト分析
レビュー分類
ポーランド語製品レビューの感情または主題分類
AllegroReviewsデータセットで40.26%の精度を達成
情報検索
ドキュメント検索
ポーランド語ドキュメント類似性検索と検索
DBPedia-PLデータセットで25.24%のmap@1000を達成
意味分析
意味的類似度評価
ポーランド語の文ペアの意味的類似度を評価
CDSC-Rデータセットで92.55のSpearman相関係数を達成
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase