R

Roberta Large Bne

由PlanTL-GOB-ES開發
基於西班牙國家圖書館(BNE)數據訓練的RoBERTa大型西班牙語語言模型
下載量 1,685
發布時間 : 3/2/2022

模型概述

基於Transformer架構的西班牙語掩碼語言模型,使用RoBERTa大型架構,在570GB清潔西班牙語語料上訓練

模型特點

大規模西班牙語預訓練
使用西班牙國家圖書館2009-2019年間570GB清潔去重文本訓練
RoBERTa優化架構
採用RoBERTa-large架構,針對西班牙語進行優化
多任務適用性
支持多種下游NLP任務的微調,如問答、文本分類等

模型能力

掩碼語言建模
文本特徵提取
命名實體識別
文本分類
問答系統

使用案例

自然語言處理
文本分類
對西班牙語文本進行分類任務
在MLDoc數據集上F1得分0.9702
命名實體識別
識別西班牙語文本中的命名實體
在CoNLL-NERC數據集上F1得分0.8823
語義理解
語義相似度計算
計算西班牙語句子間的語義相似度
在STS數據集上綜合得分0.8411
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase