B

Bert Base Thai

monsoon-nlpによって開発
BERT-Baseアーキテクチャに基づくタイ語専用事前学習モデル。タイ語の分かち書き特性に最適化され、多言語BERTを上回る性能を提供
ダウンロード数 177
リリース時間 : 3/2/2022

モデル概要

このプロジェクトはタイ語に最適化されたBERTモデルを提供し、タイ語が分かち書きの難しさにより元の多言語BERTから除外されていた問題を解決。カスタマイズされた前処理と分かち書き手法により、タイ語テキスト処理の効果を大幅に向上。

モデル特徴

タイ語専用分かち書き
BPEmbで事前学習された25000語彙のSentencePieceモデルを採用。タイ語の明示的な区切り文字がない特性に最適化
性能優位性
XNLIタイ語タスクで多言語BERTモデルより2.8%精度向上
完全な前処理フロー
生のタイ語テキストからモデル入力までの完全な前処理ソリューションを提供。特殊な文分割処理を含む

モデル能力

タイ語テキスト表現
文間関係理解
下流タスクのファインチューニング

使用事例

テキスト分類
レストランレビュー分類
Wongnaiプラットフォームのレストランレビューを1-5段階で評価
公開テストセットで0.56612の精度を達成
言語間理解
XNLIタイ語タスク
タイ語自然言語推論タスク
68.9%の精度を達成、多言語BERTモデルを上回る
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase