I

Indicbartss

由ai4bharat開發
IndicBARTSS是一個專注於印度語言和英語的多語言序列到序列預訓練模型,支持11種印度語言和英語,適用於自然語言生成任務。
下載量 564
發布時間 : 3/15/2022

模型概述

IndicBARTSS基於mBART架構,是一個多語言序列到序列預訓練模型,專門針對印度語言和英語設計。它支持多種自然語言生成任務,如機器翻譯、摘要和問題生成等。

模型特點

多語言支持
支持11種印度語言和英語,這些語言並非全部被mBART50和mT5支持。
計算效率高
模型比mBART和mT5(基礎版)小得多,因此在微調和解碼時計算成本更低。
大規模預訓練
在大型印度語言語料庫(4.52億句子和90億標記)上訓練,其中包括印度英語內容。
原生文字支持
每種語言都使用其自己的文字書寫,不需要進行任何與梵文的文字映射。

模型能力

文本生成
機器翻譯
文本摘要
問題生成

使用案例

自然語言處理
機器翻譯
將英語翻譯為多種印度語言,或將印度語言翻譯為英語。
文本摘要
生成印度語言或英語文本的摘要。
問題生成
基於給定的文本生成相關問題。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase