I

Indicbart

由ai4bharat開發
IndicBART是一個專注於印度語言和英語的多語言序列到序列預訓練模型,支持11種印度語言,基於mBART架構構建。
下載量 4,120
發布時間 : 3/2/2022

模型概述

IndicBART是一個多語言序列到序列預訓練模型,專注於印度語言和英語的自然語言生成任務,如機器翻譯、摘要生成和問題生成等。

模型特點

多語言支持
支持11種印度語言和英語,包括阿薩姆語、孟加拉語、古吉拉特語等。
高效計算
模型比mBART和mT5(基礎版)小得多,因此在微調和解碼時計算成本更低。
大規模預訓練
在大型印度語言語料庫(4.52億句子和90億詞元)上訓練,其中包括印度英語內容。
統一書寫系統
除英語外,所有語言均以天城文書寫,以促進相關語言之間的遷移學習。

模型能力

文本生成
機器翻譯
摘要生成
問題生成

使用案例

自然語言處理
機器翻譯
將英語翻譯為印度語言或將印度語言翻譯為英語。
摘要生成
生成印度語言文本的摘要。
問題生成
根據印度語言文本生成相關問題。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase