T

T5 Base Nl36 Finnish

由Finnish-NLP開發
基於芬蘭語預訓練的T5模型,採用基於跨度的掩碼語言建模目標,需針對下游任務微調後使用
下載量 19
發布時間 : 4/15/2022

模型概述

這是一個基於自監督方式在大量芬蘭語語料上預訓練的T5模型,採用編碼器-解碼器架構,處理所有NLP問題為文本到文本格式。模型需針對特定任務微調後才能實際應用。

模型特點

高效深度架構
採用36層transformer的深度-窄型架構,相比標準T5-base的12層有更好性能
改進的預訓練技術
使用T5 v1.1改進:GEGLU激活函數、無dropout預訓練、純MLM目標訓練
高質量訓練數據
使用經過嚴格清洗的76GB芬蘭語文本,包含維基百科、新聞等多種來源

模型能力

文本生成
文本轉換
序列到序列任務

使用案例

文本處理
大小寫和標點校正
微調後可自動修正芬蘭語文本的大小寫和標點錯誤
參考Finnish-NLP/t5-small-nl24-casing-punctuation-correction模型
文本分類
新聞分類
在Yle新聞數據集上微調後達到94.4%準確率
優於同參數規模的多語言mT5模型
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase