B

Banglat5 Small

由 csebuetnlp 开发
基于序列到序列Transformer架构的孟加拉语预训练模型,专为自然语言生成任务优化
下载量 510
发布时间 : 2/9/2023

模型简介

这是一个针对孟加拉语优化的T5模型,通过Span Corruption目标进行预训练,适用于多种自然语言生成任务

模型特点

多任务适应能力
模型设计支持多种NLG任务,包括机器翻译、文本摘要和问答系统
优化的预处理管道
使用专门的文本归一化方法预处理数据,确保最佳性能
小规模高效架构
相比同类模型参数更少但性能优越,适合资源有限的环境

模型能力

机器翻译
抽象文本摘要
问答系统
多轮对话生成
新闻标题生成
跨语言摘要

使用案例

文本转换
孟加拉语-英语机器翻译
将孟加拉语文本翻译为英语
SacreBLEU得分38.8/25.2
文本摘要
新闻文章摘要
生成孟加拉语新闻文章的简短摘要
ROUGE-2得分13.7
问答系统
开放领域问答
回答基于孟加拉语文本的问题
EM/F1得分68.5/74.8
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase