I

Indicbertv2 MLM Only

Developed by ai4bharat
IndicBERTは、23種類のインド語と英語をサポートする多言語言語モデルで、2億7800万のパラメータを持ち、IndicCorp v2で学習され、IndicXTREMEベンチマークテストで評価されています。
Downloads 87.60k
Release Time : 11/13/2022

Model Overview

IndicBERTは、インド語の処理に特化した多言語BERTスタイルのモデルで、複数の学習目標とデータセットを通じて最適化され、マスク付きトークン予測タスクをサポートします。

Model Features

多言語対応
23種類のインド語と英語をサポートし、複数の言語ファミリーをカバーします。
複数の学習目標
MLM、TLM、逆翻訳などの複数の目標を通じて学習し、モデルの性能を向上させます。
語彙共有の最適化
IndicBERT - SSバージョンは、文字変換を通じて言語間の語彙共有を改善します。

Model Capabilities

多言語テキスト理解
マスク付きトークン予測タスクの処理
異言語間の転移学習

Use Cases

自然言語理解
固有表現抽出
複数のインド語で固有表現を識別します。
感情分析
インド語のテキストの感情傾向を分析します。
機械翻訳支援
平行コーパスの強化
TLM学習により機械翻訳モデルの性能を向上させます。
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase