R

Roberta TR Medium Morph 44k

由ctoraman開發
基於土耳其語的RoBERTa模型,採用形態級分詞和掩碼語言建模目標預訓練,適用於土耳其語自然語言處理任務。
下載量 453
發布時間 : 3/9/2022

模型概述

該模型是針對土耳其語優化的RoBERTa變體,採用形態級分詞(使用Zemberek形態分析器)和無大小寫格式,適用於各類土耳其語文本處理任務。

模型特點

形態級分詞
使用Zemberek土耳其語形態分析器進行文本切分,實現更符合土耳其語特點的分詞處理。
無大小寫格式
模型輸入不區分大小寫,簡化預處理流程並提高泛化能力。
中等規模架構
採用8層Transformer結構,在計算效率和性能之間取得平衡。

模型能力

土耳其語文本理解
掩碼語言建模
序列分類(需微調)

使用案例

自然語言處理
土耳其語文本分類
通過微調模型實現新聞分類、情感分析等任務。
語言模型預訓練
作為基礎模型用於土耳其語NLP任務的遷移學習。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase