I

Indicbart

ai4bharatによって開発
IndicBARTはインドの言語と英語に特化した多言語シーケンス・ツー・シーケンス事前学習モデルで、11のインド言語をサポートし、mBARTアーキテクチャに基づいて構築されています。
ダウンロード数 4,120
リリース時間 : 3/2/2022

モデル概要

IndicBARTは、機械翻訳、要約生成、質問生成などの自然言語生成タスクに特化した、インドの言語と英語のための多言語シーケンス・ツー・シーケンス事前学習モデルです。

モデル特徴

多言語サポート
アッサム語、ベンガル語、グジャラート語など11のインド言語と英語をサポートしています。
効率的な計算
モデルはmBARTやmT5(ベース版)よりもはるかに小さいため、ファインチューニングやデコード時の計算コストが低くなります。
大規模事前学習
インド英語コンテンツを含む大規模なインド言語コーパス(4億5200万文、90億トークン)でトレーニングされています。
統一書記体系
英語を除くすべての言語はデーヴァナーガリ文字で記述されており、関連言語間の転移学習を促進します。

モデル能力

テキスト生成
機械翻訳
要約生成
質問生成

使用事例

自然言語処理
機械翻訳
英語からインド言語へ、またはインド言語から英語へ翻訳します。
要約生成
インド言語のテキストの要約を生成します。
質問生成
インド言語のテキストに基づいて関連する質問を生成します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase