I

Indicbertv2 MLM Only

ai4bharatによって開発
IndicBERTは、23種類のインド語と英語をサポートする多言語言語モデルで、2億7800万のパラメータを持ち、IndicCorp v2で学習され、IndicXTREMEベンチマークテストで評価されています。
ダウンロード数 87.60k
リリース時間 : 11/13/2022

モデル概要

IndicBERTは、インド語の処理に特化した多言語BERTスタイルのモデルで、複数の学習目標とデータセットを通じて最適化され、マスク付きトークン予測タスクをサポートします。

モデル特徴

多言語対応
23種類のインド語と英語をサポートし、複数の言語ファミリーをカバーします。
複数の学習目標
MLM、TLM、逆翻訳などの複数の目標を通じて学習し、モデルの性能を向上させます。
語彙共有の最適化
IndicBERT - SSバージョンは、文字変換を通じて言語間の語彙共有を改善します。

モデル能力

多言語テキスト理解
マスク付きトークン予測タスクの処理
異言語間の転移学習

使用事例

自然言語理解
固有表現抽出
複数のインド語で固有表現を識別します。
感情分析
インド語のテキストの感情傾向を分析します。
機械翻訳支援
平行コーパスの強化
TLM学習により機械翻訳モデルの性能を向上させます。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase