X

XLMR MaCoCu Tr

由MaCoCu開發
XLMR-MaCoCu-tr 是基於土耳其語文本大規模預訓練的語言模型,是MaCoCu項目的一部分,使用35GB土耳其語文本訓練。
下載量 26
發布時間 : 8/11/2022

模型概述

該模型在XLM-RoBERTa-large模型基礎上繼續訓練,專為土耳其語設計,適用於多種自然語言處理任務。

模型特點

大規模土耳其語訓練
使用35GB土耳其語文本(44億詞符)進行訓練,覆蓋廣泛的語言特徵。
基於XLM-RoBERTa-large優化
在XLM-RoBERTa-large基礎上繼續訓練,保持原有詞表,優化土耳其語處理能力。
多任務性能優越
在POS標註、NER和COPA等任務上表現優異,超越同類土耳其語模型。

模型能力

詞性標註(UPOS/XPOS)
命名實體識別(NER)
因果推理(COPA)
土耳其語文本理解

使用案例

自然語言處理
土耳其語文本標註
用於土耳其語文本的詞性標註和命名實體識別。
在Universal Dependencies測試集上達到94.4%的NER準確率。
因果推理
用於土耳其語因果推理任務(COPA)。
在MT測試集上達到60.7%的準確率,優於BERTurk和XLM-R-large。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase