T

T5 Efficient Xl

由google開發
T5高效XL是谷歌T5模型的深度窄型變體,專注於通過增加模型深度而非寬度來提升下游任務性能。
下載量 63
發布時間 : 3/2/2022

模型概述

這是一個僅預訓練的檢查點,採用深度窄型架構設計,旨在通過增加Transformer塊數量來優化模型性能。

模型特點

深度窄型架構
優先增加模型深度而非寬度,相比同等參數量的其他架構對下游任務更有利
高效預訓練
在C4數據集上進行了524288步的預訓練,使用跨度的掩碼語言建模目標
參數優化
全精度下約需11406.62 MB內存,半精度下約需5703.31 MB內存

模型能力

文本生成
文本摘要
問答系統
文本分類(需微調)

使用案例

文本處理
自動摘要生成
將長文檔自動壓縮為簡潔摘要
問答系統
基於給定文本回答用戶問題
內容生成
文本續寫
根據提示生成連貫的後續文本
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase