B

Banglat5 Small

由csebuetnlp開發
基於序列到序列Transformer架構的孟加拉語預訓練模型,專為自然語言生成任務優化
下載量 510
發布時間 : 2/9/2023

模型概述

這是一個針對孟加拉語優化的T5模型,通過Span Corruption目標進行預訓練,適用於多種自然語言生成任務

模型特點

多任務適應能力
模型設計支持多種NLG任務,包括機器翻譯、文本摘要和問答系統
優化的預處理管道
使用專門的文本歸一化方法預處理數據,確保最佳性能
小規模高效架構
相比同類模型參數更少但性能優越,適合資源有限的環境

模型能力

機器翻譯
抽象文本摘要
問答系統
多輪對話生成
新聞標題生成
跨語言摘要

使用案例

文本轉換
孟加拉語-英語機器翻譯
將孟加拉語文本翻譯為英語
SacreBLEU得分38.8/25.2
文本摘要
新聞文章摘要
生成孟加拉語新聞文章的簡短摘要
ROUGE-2得分13.7
問答系統
開放領域問答
回答基於孟加拉語文本的問題
EM/F1得分68.5/74.8
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase