I

Indicbartss

由 ai4bharat 开发
IndicBARTSS是一个专注于印度语言和英语的多语言序列到序列预训练模型,支持11种印度语言和英语,适用于自然语言生成任务。
下载量 564
发布时间 : 3/15/2022

模型简介

IndicBARTSS基于mBART架构,是一个多语言序列到序列预训练模型,专门针对印度语言和英语设计。它支持多种自然语言生成任务,如机器翻译、摘要和问题生成等。

模型特点

多语言支持
支持11种印度语言和英语,这些语言并非全部被mBART50和mT5支持。
计算效率高
模型比mBART和mT5(基础版)小得多,因此在微调和解码时计算成本更低。
大规模预训练
在大型印度语言语料库(4.52亿句子和90亿标记)上训练,其中包括印度英语内容。
原生文字支持
每种语言都使用其自己的文字书写,不需要进行任何与梵文的文字映射。

模型能力

文本生成
机器翻译
文本摘要
问题生成

使用案例

自然语言处理
机器翻译
将英语翻译为多种印度语言,或将印度语言翻译为英语。
文本摘要
生成印度语言或英语文本的摘要。
问题生成
基于给定的文本生成相关问题。
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase