T

T5 Base Nl36 Finnish

由 Finnish-NLP 开发
基于芬兰语预训练的T5模型,采用基于跨度的掩码语言建模目标,需针对下游任务微调后使用
下载量 19
发布时间 : 4/15/2022

模型简介

这是一个基于自监督方式在大量芬兰语语料上预训练的T5模型,采用编码器-解码器架构,处理所有NLP问题为文本到文本格式。模型需针对特定任务微调后才能实际应用。

模型特点

高效深度架构
采用36层transformer的深度-窄型架构,相比标准T5-base的12层有更好性能
改进的预训练技术
使用T5 v1.1改进:GEGLU激活函数、无dropout预训练、纯MLM目标训练
高质量训练数据
使用经过严格清洗的76GB芬兰语文本,包含维基百科、新闻等多种来源

模型能力

文本生成
文本转换
序列到序列任务

使用案例

文本处理
大小写和标点校正
微调后可自动修正芬兰语文本的大小写和标点错误
参考Finnish-NLP/t5-small-nl24-casing-punctuation-correction模型
文本分类
新闻分类
在Yle新闻数据集上微调后达到94.4%准确率
优于同参数规模的多语言mT5模型
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase