S

Sinhalaberto

由keshan開發
這是一個基於OSCAR僧伽羅語去重數據集訓練的稍小模型,為低資源僧伽羅語提供基礎支持。
下載量 34
發布時間 : 3/2/2022

模型概述

該模型是基於Roberta架構訓練的僧伽羅語語言模型,主要用於掩碼語言建模任務,為下游任務提供預訓練基礎。

模型特點

低資源語言支持
專門針對資源稀缺的僧伽羅語進行優化訓練
輕量級架構
採用6層隱藏層的精簡Roberta架構,適合資源有限環境
大規模預訓練數據
基於OSCAR去重數據集訓練,涵蓋廣泛語言特徵

模型能力

文本填充
語言建模
上下文預測

使用案例

自然語言處理
文本補全
自動補全僧伽羅語句子中的缺失部分
可準確預測句子中被掩碼的詞彙
語言模型微調
作為下游NLP任務的預訓練基礎模型
為各類僧伽羅語NLP應用提供遷移學習基礎
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase