R

Roberta Large Finnish

由Finnish-NLP開發
基於掩碼語言建模(MLM)目標預訓練的芬蘭語RoBERTa模型,支持雙向上下文理解
下載量 24
發布時間 : 3/2/2022

模型概述

該模型通過自監督學習在海量芬蘭語文本上預訓練,主要用於下游任務的微調,如序列分類、標記分類或問答任務。

模型特點

大規模芬蘭語預訓練
基於78GB清洗後的芬蘭語數據訓練,包含多個高質量語料庫
動態遮蔽策略
採用RoBERTa特有的動態遮蔽技術,在預訓練期間隨機變化遮蔽模式
完整句子理解
支持512標記的連續文本處理,適合需要完整句子理解的任務

模型能力

芬蘭語文本理解
掩碼詞彙預測
文本特徵提取

使用案例

文本分類
新聞分類
對芬蘭語新聞文章進行分類
在Yle新聞數據集上達到94.53%準確率
議會數據分析
對芬蘭議會文本進行分類
在議會數據集上達到74.30%準確率
語言理解
語義分析
提取芬蘭語文本的深層語義特徵
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase