B

Bengali T5 Base

由flax-community開發
基於MT5數據集中孟加拉語部分訓練的T5基礎模型,由HuggingFace社區開發
下載量 57
發布時間 : 3/2/2022

模型概述

這是一個專門針對孟加拉語訓練的T5基礎模型,採用去噪目標進行預訓練,適合作為下游任務的基座模型

模型特點

孟加拉語專用
專門針對孟加拉語優化的預訓練模型
大規模訓練
使用約110億token的孟加拉語數據進行訓練
TPU加速訓練
利用谷歌提供的TPU算力進行高效訓練

模型能力

文本去噪
語言模型預訓練
孟加拉語文本處理

使用案例

自然語言處理
孟加拉語文本生成
可作為基礎模型進行微調後用於孟加拉語文本生成
需進行前綴語言模型微調後才能獲得生成能力
下游任務微調
可用於各類孟加拉語NLP任務的基座模型
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase