I

Indobert Lite Large P1

indobenchmarkによって開発
IndoBERTはインドネシア語用の先進的な言語モデルで、BERTアーキテクチャに基づき、マスク言語モデリングと次文予測の目的で訓練されています。
ダウンロード数 42
リリース時間 : 3/2/2022

モデル概要

IndoBERTはインドネシア語用に特別に設計された事前学習言語モデルで、主に自然言語理解タスクに使用されます。このモデルは大規模なインドネシア語コーパスで訓練され、インドネシア語テキストの意味理解タスクを効果的に処理できます。

モデル特徴

インドネシア語向け最適化
インドネシア語用に特別に設計・訓練されており、インドネシア語テキストをよりよく理解し処理できます。
軽量級モデル
完全版のIndoBERTと比較して、Liteバージョンのパラメータが少なく、リソースが限られた環境に適しています。
大規模訓練データ
Indo4Bデータセット(23.43GBのインドネシア語テキスト)を使用して訓練されています。

モデル能力

インドネシア語テキスト理解
マスク言語モデリング
次文予測

使用事例

自然言語処理
テキスト分類
インドネシア語テキストの分類タスクを行う
固有表現抽出
インドネシア語テキスト内の固有表現を識別する
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase