M

Mk Roberta Base

由macedonizer開發
基於馬其頓語訓練的掩碼語言建模預訓練模型,區分大小寫處理
下載量 18
發布時間 : 3/2/2022

模型概述

該模型是通過自監督方式在大規模馬其頓語文本上預訓練的transformer模型,採用掩碼語言建模目標,學習馬其頓語的雙向表徵,適用於下游任務的微調。

模型特點

雙向語境理解
通過遮蔽語言建模目標實現雙向語境表徵,優於傳統單向語言模型
馬其頓語優化
專門針對馬其頓語特性訓練,包含大小寫敏感處理能力
大規模預訓練
基於馬其頓語維基百科和時政新聞數據集訓練,覆蓋廣泛領域

模型能力

文本特徵提取
掩碼詞彙預測
下游任務微調

使用案例

文本理解
序列分類
用於情感分析或主題分類任務
命名實體識別
識別馬其頓語文本中的人名、地名等實體
語言教育
語法填空
生成馬其頓語語法練習材料
示例顯示能準確預測'Скопје е главен град'等常見表達
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase