R

Roberta Large Finnish

Developed by Finnish-NLP
基於掩碼語言建模(MLM)目標預訓練的芬蘭語RoBERTa模型,支持雙向上下文理解
Downloads 24
Release Time : 3/2/2022

Model Overview

該模型通過自監督學習在海量芬蘭語文本上預訓練,主要用於下游任務的微調,如序列分類、標記分類或問答任務。

Model Features

大規模芬蘭語預訓練
基於78GB清洗後的芬蘭語數據訓練,包含多個高質量語料庫
動態遮蔽策略
採用RoBERTa特有的動態遮蔽技術,在預訓練期間隨機變化遮蔽模式
完整句子理解
支持512標記的連續文本處理,適合需要完整句子理解的任務

Model Capabilities

芬蘭語文本理解
掩碼詞彙預測
文本特徵提取

Use Cases

文本分類
新聞分類
對芬蘭語新聞文章進行分類
在Yle新聞數據集上達到94.53%準確率
議會數據分析
對芬蘭議會文本進行分類
在議會數據集上達到74.30%準確率
語言理解
語義分析
提取芬蘭語文本的深層語義特徵
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase