T

T5 Efficient Tiny Nl32

由google開發
T5-Efficient-TINY-NL32是Google原版T5的一個變體,採用深度窄型架構,優先增加模型深度以優化下游任務性能。
下載量 209
發布時間 : 3/2/2022

模型概述

這是一個僅預訓練的檢查點,基於T5模型架構,採用深度窄型設計,適用於英語NLP任務。

模型特點

深度窄型架構
優先增加模型深度而非寬度,在相同參數數量下提供更好的下游任務性能
高效預訓練
在C4數據集上進行524288步預訓練,使用跨度的掩碼語言建模目標
參數效率
67.06百萬參數的緊湊設計,全精度下僅需約268.25 MB內存

模型能力

文本生成
摘要生成
問答系統
文本分類

使用案例

文本摘要
新聞摘要生成
將長篇文章自動壓縮為簡潔摘要
問答系統
開放域問答
基於給定文本回答用戶問題
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase