W

Wangchanberta Base Att Spm Uncased

由airesearch開發
基於78.5GB泰語文本預訓練的RoBERTa BASE模型,適用於掩碼語言建模及文本分類任務
下載量 34.38k
發布時間 : 3/2/2022

模型概述

該模型是基於RoBERTa架構的泰語預訓練模型,主要用於掩碼語言建模預測和文本分類任務。支持多種下游NLP應用。

模型特點

大規模泰語預訓練
基於78.5GB泰語文本數據訓練,具有優秀的泰語理解能力
多任務支持
支持掩碼語言建模、文本分類和序列標記等多種NLP任務
RoBERTa優化架構
採用改進的RoBERTa架構,具有更強的上下文理解能力

模型能力

泰語文本理解
掩碼語言預測
情感分析
文本分類
序列標記

使用案例

社交媒體分析
情感分析
分析泰語社交媒體帖子的情感傾向
可分類為積極/中立/消極/提問四類情感
評論分析
評論星級預測
預測用戶評論的星級(1-5星)
在Wongnai評論數據集上表現良好
新聞分類
多標籤主題分類
對泰語新聞進行12類主題分類
在Prachathai67k數據集上實現多標籤分類
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase