R

Roberta Large Bne

由 PlanTL-GOB-ES 开发
基于西班牙国家图书馆(BNE)数据训练的RoBERTa大型西班牙语语言模型
下载量 1,685
发布时间 : 3/2/2022

模型简介

基于Transformer架构的西班牙语掩码语言模型,使用RoBERTa大型架构,在570GB清洁西班牙语语料上训练

模型特点

大规模西班牙语预训练
使用西班牙国家图书馆2009-2019年间570GB清洁去重文本训练
RoBERTa优化架构
采用RoBERTa-large架构,针对西班牙语进行优化
多任务适用性
支持多种下游NLP任务的微调,如问答、文本分类等

模型能力

掩码语言建模
文本特征提取
命名实体识别
文本分类
问答系统

使用案例

自然语言处理
文本分类
对西班牙语文本进行分类任务
在MLDoc数据集上F1得分0.9702
命名实体识别
识别西班牙语文本中的命名实体
在CoNLL-NERC数据集上F1得分0.8823
语义理解
语义相似度计算
计算西班牙语句子间的语义相似度
在STS数据集上综合得分0.8411
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase