R

Roberta Large Finnish

Finnish-NLPによって開発
マスク言語モデリング(MLM)目標で事前学習されたフィンランド語RoBERTaモデル、双方向コンテキスト理解をサポート
ダウンロード数 24
リリース時間 : 3/2/2022

モデル概要

このモデルは自己教師あり学習で大量のフィンランド語テキスト上で事前学習され、主にシーケンス分類、トークン分類、質問応答タスクなどの下流タスクのファインチューニングに使用されます。

モデル特徴

大規模フィンランド語事前学習
78GBのクリーニング済みフィンランド語データでトレーニング、複数の高品質コーパスを含む
動的マスキング戦略
RoBERTa特有の動的マスキング技術を採用、事前学習中にランダムにマスキングパターンを変化
完全文理解
512トークンの連続テキスト処理をサポート、完全な文理解が必要なタスクに適している

モデル能力

フィンランド語テキスト理解
マスク単語予測
テキスト特徴抽出

使用事例

テキスト分類
ニュース分類
フィンランド語ニュース記事を分類
Yleニュースデータセットで94.53%の精度を達成
議会データ分析
フィンランド議会テキストを分類
議会データセットで74.30%の精度を達成
言語理解
意味解析
フィンランド語テキストの深層意味特徴を抽出
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase