M

Myanberta

由UCSYNLP開發
MyanBERTa是基於BERT架構的緬甸語預訓練語言模型,在包含5,992,299個句子的緬甸語數據集上進行了預訓練。
下載量 91
發布時間 : 7/25/2022

模型概述

該模型是一個專門針對緬甸語的預訓練語言模型,採用BERT架構和字節級BPE分詞器,適用於各種緬甸語自然語言處理任務。

模型特點

緬甸語專用
專門針對緬甸語設計和優化,能夠更好地處理緬甸語的語言特性。
大規模預訓練
在包含5,992,299個句子(1.36億詞)的大規模緬甸語數據集上進行預訓練。
高效分詞
採用字節級BPE分詞器,學習得到30,522個子詞單元作為分詞工具。

模型能力

緬甸語文本理解
緬甸語文本生成
緬甸語語言特徵提取

使用案例

自然語言處理
緬甸語文本分類
對緬甸語文本進行情感分析或主題分類
緬甸語問答系統
構建基於緬甸語的智能問答應用
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase