T

T5 Efficient Tiny

由google開發
T5-Efficient-TINY是谷歌T5模型的深度窄型變體,專注於通過增加模型深度而非寬度來提升下游任務性能。
下載量 8,337
發布時間 : 3/2/2022

模型概述

這是一個僅預訓練的T5模型檢查點,採用深度窄型架構設計,適用於英語NLP任務的微調。

模型特點

深度窄型架構
優先增加模型深度而非寬度,在相同參數規模下提供更好的下游任務性能
高效預訓練
在C4數據集上進行了524,288步的跨度的掩碼語言建模預訓練
緊湊尺寸
僅15.58M參數,全精度下約62.32MB內存佔用,適合資源有限環境

模型能力

文本生成
文本摘要
問答系統
文本分類(需調整)

使用案例

文本處理
新聞摘要生成
將長篇文章自動壓縮為簡潔摘要
開放域問答
基於給定文本回答用戶問題
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase