T

T5 Efficient Mini

由google開發
T5-Efficient-MINI是谷歌原版T5的一個變體,採用深度窄型架構,在參數數量相似的模型架構中表現出更優的下游任務性能。
下載量 946
發布時間 : 3/2/2022

模型概述

這是一個僅預訓練的檢查點,基於T5模型架構,採用深度窄型設計策略,優先增加模型深度以提高效率。

模型特點

深度窄型架構
優先增加模型深度而非寬度,在相同參數數量下提供更好的下游任務性能。
高效預訓練
在C4數據集上進行了524,288步的預訓練,使用跨度的掩碼語言建模目標。
緊湊模型尺寸
僅31.23百萬參數,全精度下約124.92MB內存需求,適合資源有限場景。

模型能力

文本生成
文本摘要
問答系統
文本分類

使用案例

文本處理
摘要生成
對長文本生成簡潔摘要
問答系統
基於給定文本回答相關問題
文本分類
對文本內容進行分類
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase