X

Xlm Roberta Large Masakhaner

由Davlan開發
首個針對10種非洲語言的命名實體識別模型,基於XLM-RoBERTa large微調,支持識別日期、地點、組織和人物四類實體。
下載量 104
發布時間 : 3/2/2022

模型概述

該模型是針對非洲語言優化的命名實體識別(NER)模型,在MasakhaNER數據集上微調,能夠處理10種非洲語言的文本實體識別任務。

模型特點

多語言支持
支持10種非洲語言的命名實體識別,填補了非洲語言NLP工具的空白。
最先進性能
在MasakhaNER數據集上實現了當前最優的NER性能,F1分數最高達91.75(豪薩語)。
細粒度實體分類
能識別四類實體(DATE/LOC/ORG/PER)及其起始位置(B-/I-標記)。

模型能力

非洲語言文本處理
命名實體識別
多語言NLP

使用案例

新聞分析
非洲新聞實體提取
從非洲各語言的新聞文章中自動提取人物、組織、地點等關鍵信息
F1分數70.70-91.75(依語言不同)
跨語言信息處理
多語言文檔分析
處理包含多種非洲語言的混合文本中的實體信息
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase