I

Indobert Large P1

indobenchmarkによって開発
IndoBERTはBERTモデルに基づくインドネシア語の先進的な言語モデルで、マスク言語モデリングと次文予測目標で訓練されています。
ダウンロード数 1,686
リリース時間 : 3/2/2022

モデル概要

IndoBERTはインドネシア語に最適化された事前学習言語モデルで、様々な自然言語処理タスクに適しています。

モデル特徴

大規模事前学習
Indo4Bデータセット(23.43GBテキスト)を使用した事前学習
大文字小文字区別なし
モデルはテキスト処理時に大文字小文字を区別しません
二段階訓練
モデルは二段階の訓練プロセス(P1とP2)を経ています

モデル能力

テキスト表現学習
言語理解
テキスト分類
質問応答システム
固有表現認識

使用事例

自然言語処理
テキスト分類
インドネシア語テキストの分類
質問応答システム
インドネシア語質問応答システムの構築
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase