X

Xlm Roberta Large Ner Kazakh

由yeshpanovrustem開發
基於XLM-RoBERTa-large架構的哈薩克語命名實體識別模型,在KazNERD數據集上訓練,支持多種實體類型識別
下載量 99
發布時間 : 5/19/2023

模型概述

該模型專門用於哈薩克語文本中的命名實體識別任務,能夠識別地理位置、人名、組織名等多種實體類型

模型特點

高精度哈薩克語NER
在驗證集和測試集上F1值均超過96%,表現優異
多類別實體識別
支持識別諺語、藝術品、基數詞、聯繫方式、日期等多種實體類型
基於KazNERD數據集
使用經過清洗的哈薩克語命名實體識別數據集訓練,數據質量高

模型能力

哈薩克語文本處理
命名實體識別
序列標註

使用案例

文本分析
新聞文本分析
從哈薩克語新聞中提取關鍵實體信息
可準確識別地理位置、人名等關鍵信息
商業文檔處理
分析哈薩克斯坦與歐盟貿易文檔中的關鍵數據
能識別金額、日期等關鍵商業實體
學術研究
哈薩克語語言學研究
支持哈薩克語語言結構和實體分佈研究
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase