R

Roberta Base Bne Capitel Ner

由PlanTL-GOB-ES開發
基於RoBERTa架構的西班牙語命名實體識別模型,在BNE語料庫上預訓練並在CAPITEL-NERC數據集上微調
下載量 8,221
發布時間 : 3/2/2022

模型概述

該模型專門用於西班牙語命名實體識別(NER)任務,能夠識別文本中的人名、地名等實體

模型特點

大規模預訓練
使用570GB經過清洗的西班牙語文本進行預訓練
專業領域微調
在CAPITEL-NERC競賽數據集上專門針對命名實體識別任務進行微調
高性能表現
在CAPITEL-NERC測試集上達到89.60的F1值,優於同類基線模型

模型能力

西班牙語文本處理
命名實體識別
人名識別
地名識別
組織機構名識別

使用案例

信息提取
文檔實體提取
從西班牙語文檔中自動提取人名、地名等實體信息
準確識別文本中的命名實體
內容分類
基於識別出的實體對文檔內容進行分類
提高文檔分類的準確性
知識圖譜構建
實體關係抽取
作為知識圖譜構建的前期處理步驟
為後續關係抽取提供基礎
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase