B

Bert Base Thai

由monsoon-nlp開發
基於BERT-Base架構的泰語專用預訓練模型,針對泰語分詞特點優化,提供優於多語言BERT的性能表現
下載量 177
發布時間 : 3/2/2022

模型概述

該項目提供了專門針對泰語優化的BERT模型,解決了泰語因分詞困難被排除在原始多語言BERT之外的問題。通過定製化的預處理和分詞方法,顯著提升了泰語文本處理效果。

模型特點

泰語專用分詞
採用BPEmb預訓練的25000詞表SentencePiece模型,針對泰語無顯式分隔符的特點優化
性能優勢
在XNLI泰語任務上比多語言BERT模型提升2.8%準確率
完整預處理流程
提供從原始泰語文本到模型輸入的完整預處理方案,包括特殊句子分割處理

模型能力

泰語文本表示
跨句子關係理解
下游任務微調

使用案例

文本分類
餐館評論分類
對Wongnai平臺的餐館評論進行1-5星評級
在公開測試集達到0.56612準確率
跨語言理解
XNLI泰語任務
泰語自然語言推理任務
達到68.9%準確率,優於多語言BERT模型
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase