R

Roberta Base Turkish Uncased

由TURKCELL開發
這是一個基於土耳其語的RoBERTa基礎模型,預訓練數據來源於土耳其語維基百科、土耳其語OSCAR語料庫以及部分新聞網站。
下載量 109
發布時間 : 12/7/2023

模型概述

該模型是一個土耳其語的無大小寫RoBERTa模型,主要用於土耳其語的文本理解和生成任務。

模型特點

大規模預訓練數據
使用38GB土耳其語文本數據訓練,包含329,720,508個句子。
高性能硬件訓練
使用Intel Xeon Gold處理器和Tesla V100顯卡進行訓練。
土耳其語優化
專門針對土耳其語特性進行優化,包含土耳其語維基百科和新聞數據。

模型能力

土耳其語文本理解
掩碼語言建模
文本填空任務

使用案例

自然語言處理
文本填空
預測句子中被掩碼的詞語
如示例所示,能準確預測'iki ülke arasında <mask> başladı'中的空白詞語
文本生成
基於上下文生成連貫的土耳其語文本
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase