R

Roberta Large Bne Capitel Pos

由PlanTL-GOB-ES開發
基於西班牙國家圖書館(BNE)數據訓練的RoBERTa-large模型,針對CAPITEL詞性標註數據集微調的西班牙語詞性標註模型
下載量 186
發布時間 : 3/2/2022

模型概述

該模型專門用於西班牙語文本的詞性標註任務,基於大規模西班牙語語料庫預訓練,並在CAPITEL-POS數據集上微調

模型特點

大規模預訓練數據
基於570GB經清洗和去重的西班牙語文本預訓練,數據來源於西班牙國家圖書館2009-2019年的網絡爬取數據
高性能詞性標註
在CAPITEL-POS測試集上達到98.56的F1值,優於同類西班牙語模型
專業領域優化
使用IberLEF 2020 CAPITEL競賽數據集進行微調,適合處理西班牙語專業文本

模型能力

西班牙語詞性標註
文本標記分類
自然語言處理

使用案例

文本分析
新聞文本分析
分析西班牙語新聞文本中的詞性分佈
準確識別新聞文本中的各類詞性
學術研究
用於西班牙語語言學研究和教學
提供專業級的詞性標註結果
自然語言處理應用
信息提取系統
作為信息提取系統的預處理組件
提高後續處理任務的準確性
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase