B

Bangla Bert

由Kowsher開發
基於BERT架構預訓練的孟加拉語語言模型,支持掩碼語言建模任務
下載量 17
發布時間 : 3/2/2022

模型概述

這是一個專門針對孟加拉語優化的BERT模型,可用於各種自然語言處理任務,如文本分類、命名實體識別和掩碼語言預測。

模型特點

孟加拉語優化
專門針對孟加拉語進行預訓練和優化
掩碼語言預測
支持高質量的掩碼詞語預測任務
大規模語料訓練
使用約40GB的BanglaLM數據集進行訓練

模型能力

文本標記化
掩碼語言預測
文本理解
語言建模

使用案例

自然語言處理
文本補全
預測句子中被掩碼的詞語
示例顯示能準確預測常見短語如'বাংলা আমার অহংকার'(孟加拉是我的驕傲)
重複檢測
識別文本中的重複模式
能準確識別重複詞語如'রাজাকার'(叛徒)
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase