I

Indobert Base P2

indobenchmarkによって開発
IndoBERTはBERTモデルに基づくインドネシア語の最先端言語モデルで、マスク言語モデリングと次文予測目標を用いて訓練されています。
ダウンロード数 25.89k
リリース時間 : 3/2/2022

モデル概要

IndoBERTはインドネシア語に最適化された事前学習言語モデルで、様々な自然言語理解タスクに適しています。

モデル特徴

インドネシア語最適化
インドネシア語専用に事前学習と最適化が行われています
大規模訓練データ
23.43GBのインドネシア語テキスト(Indo4B)を使用して訓練
大文字小文字を区別しない
第2段階モデルは大文字小文字を区別せず、テキスト処理の柔軟性を向上

モデル能力

テキスト表現学習
文脈理解
言語モデリング
文関係予測

使用事例

自然言語処理
テキスト分類
インドネシア語テキスト分類タスクに使用可能
固有表現認識
インドネシア語テキスト中の固有表現を識別
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase