M

Multiindicwikibiounified

ai4bharatによって開発
IndicBARTを微調整した多言語シーケンス・ツー・シーケンスモデルで、9種類のインド言語の伝記生成をサポート
ダウンロード数 54
リリース時間 : 3/16/2022

モデル概要

このモデルはIndicWikiBioデータセットで微調整され、インド言語のWikiスタイルの伝記テキスト生成に特化しています。アッサム語、ベンガル語、ヒンディー語など様々なインド言語をサポートしています。

モデル特徴

多言語サポート
9種類のインド言語をサポートし、mBART50やmT5ではサポートされていない言語も含まれます
効率的な計算
mBARTやmT5(ベーシック版)よりも小型で、計算コストが低い
インド言語最適化
34,653のインド言語サンプルで微調整され、すべての言語はデーヴァナーガリ文字で表記され、転移学習を促進します

モデル能力

多言語テキスト生成
伝記テキスト生成
インド言語処理

使用事例

コンテンツ生成
Wikiスタイル伝記生成
構造化情報に基づいてWikipediaスタイルの伝記テキストを生成
IndicWikiBioテストセットでRougeLスコアは38.84から67.48の範囲
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase