R

Roberta Base Thai Char

由KoichiYasuoka開發
這是一個基於泰語維基百科文本預訓練的RoBERTa模型,採用字符級嵌入以適配BertTokenizerFast。
下載量 23
發布時間 : 3/2/2022

模型概述

該模型是一個基於RoBERTa架構的泰語語言模型,專門針對泰語文本進行預訓練,適用於各種自然語言處理任務。

模型特點

字符級嵌入
採用字符級嵌入方式,更好地適配泰語文本處理。
基於泰語維基百科
使用泰語維基百科文本進行預訓練,對泰語有良好的理解能力。
RoBERTa架構
基於強大的RoBERTa架構,具有優秀的語言表示能力。

模型能力

泰語文本理解
填充掩碼預測
下游任務微調

使用案例

自然語言處理
詞性標註
可用於泰語詞性標註任務
已有微調模型(roberta-base-thai-char-upos)
依存句法分析
可用於泰語句法分析任務
已有微調模型(roberta-base-thai-char-ud-goeswith)
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase