bengali-t5-base开源模型 - 免费支持孟加拉语文本处理任务

Home

Bengali T5 Base

Developed by flax-community

基于MT5数据集中孟加拉语部分训练的T5基础模型，由HuggingFace社区开发

大型语言模型 #孟加拉语T5 #去噪预训练 #110亿token

Downloads 57

Release Time : 3/2/2022

Model Overview

这是一个专门针对孟加拉语训练的T5基础模型，采用去噪目标进行预训练，适合作为下游任务的基座模型

Model Features

孟加拉语专用

专门针对孟加拉语优化的预训练模型

大规模训练

使用约110亿token的孟加拉语数据进行训练

TPU加速训练

利用谷歌提供的TPU算力进行高效训练

Model Capabilities

文本去噪

语言模型预训练

孟加拉语文本处理

Use Cases

自然语言处理

孟加拉语文本生成

可作为基础模型进行微调后用于孟加拉语文本生成

需进行前缀语言模型微调后才能获得生成能力

下游任务微调

可用于各类孟加拉语NLP任务的基座模型

Featured Recommended AI Models

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers Supports Multiple Languages

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统 Chinese

uer

2,694

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご

Bengali T5 Base

Model Overview

Model Features

Model Capabilities

Use Cases

🚀 孟加拉语T5基础模型 (bengali-t5-base)

🚀 快速开始

📦 加载分词器

📦 加载模型

🔧 技术细节

📚 相关文档

👥 参与者

🔗 有用链接