N

Nepalibert

由Shushant開發
基於尼泊爾語新聞數據的掩碼語言模型,訓練數據來自多個尼泊爾新聞網站,包含約1000萬條尼泊爾語句子,內容主要為新聞。
下載量 701.51k
發布時間 : 3/2/2022

模型概述

該模型是在BERT基礎架構上微調的尼泊爾語掩碼語言模型,主要用於尼泊爾語相關的自然語言處理任務。

模型特點

大規模尼泊爾語訓練數據
訓練數據包含約1000萬條尼泊爾語句子,主要來自新聞網站,文本量約4.6GB。
高性能評估結果
在評估集上表現良好,損失值為1.0495,困惑度為8.56。
GPU加速訓練
使用Tesla V100 GPU進行訓練,耗時約3天8小時57分鐘。

模型能力

尼泊爾語文本理解
尼泊爾語文本生成
尼泊爾語情感分析

使用案例

自然語言處理
尼泊爾語情感分析
用於分析尼泊爾推文的情感傾向
表現優於其他現有的尼泊爾語掩碼語言模型
尼泊爾語文本補全
填補尼泊爾語句子中的缺失部分
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase