T

T5 Efficient Base Nl48

由google開發
T5-Efficient-BASE-NL48 是 Google T5 的變體,採用深度窄型架構,優先增加模型深度以提高下游任務性能。
下載量 14
發布時間 : 3/2/2022

模型概述

該模型是基於 T5 架構的預訓練檢查點,採用深度窄型設計策略,在英語文本上預訓練,適用於需要微調的英語 NLP 任務。

模型特點

深度窄型架構
優先增加模型深度(48層)而非寬度,相比參數數量相近的其他架構在下游任務中表現更優
高效預訓練
在 C4 數據集上進行了 524288 步的跨度的掩碼語言建模預訓練
靈活微調
作為預訓練檢查點,可通過微調適應多種英語 NLP 任務

模型能力

文本生成
文本摘要
問答系統
文本分類

使用案例

文本處理
新聞摘要生成
微調後可用於自動生成新聞文章的簡潔摘要
開放域問答
通過微調構建能夠回答各種問題的問答系統
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase