M

Muril Base Cased

由google開發
MuRIL是一個基於17種印度語言及其轉寫文本預訓練的BERT模型,針對印度語境優化
下載量 12.72k
發布時間 : 3/2/2022

模型概述

MuRIL是基於BERT架構的多語言模型,專門針對17種印度語言進行預訓練,包含對轉寫文本的特殊優化

模型特點

多語言支持
支持17種印度語言及其轉寫文本
轉寫優化
專門針對印度語言轉寫現象進行優化
平行數據訓練
使用翻譯和轉寫文本對進行預訓練
低資源語言優化
採用0.3的上採樣指數值提升低資源語言性能

模型能力

多語言文本理解
轉寫文本處理
掩碼語言建模
跨語言遷移學習

使用案例

自然語言處理
命名實體識別
印度語言的命名實體識別任務
PANX任務平均F1達77.60%,顯著優於mBERT
詞性標註
印度語言的詞性標註任務
UDPOS任務平均F1達75.02%,優於mBERT
跨語言自然語言推理
印度語言的XNLI任務
轉寫文本準確率從39.23%提升至64.70%
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase