R

Roberta Base Turkish Uncased

由burakaytan開發
基於土耳其語預訓練的RoBERTa基礎模型,使用38GB土耳其語語料訓練
下載量 57
發布時間 : 4/20/2022

模型概述

這是一個基於土耳其語的RoBERTa基礎模型,主要用於土耳其語文本的掩碼語言建模任務,支持土耳其語文本理解和生成。

模型特點

大規模土耳其語預訓練
使用38GB土耳其語語料(包含維基百科、OSCAR語料庫和新聞網站數據)進行訓練
高性能硬件訓練
在配備Intel Xeon Gold處理器和Tesla V100顯卡的高性能硬件環境下完成訓練
優化的土耳其語處理
專門針對土耳其語特點進行優化,能更好地處理土耳其語文本

模型能力

土耳其語文本理解
掩碼語言建模
文本補全
語義分析

使用案例

文本補全
完形填空應用
預測句子中被掩碼的詞語
能準確預測土耳其語句子中被掩碼的關鍵詞語
語義分析
文本相似度計算
計算土耳其語文本之間的語義相似度
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase