T

T5 Efficient Small Dm768

由google開發
T5-Efficient-SMALL-DM768 是 Google 原始 T5 的一個變體,採用深度窄型架構,優先增加模型深度以提高下游性能。
下載量 49
發布時間 : 3/2/2022

模型概述

這是一個僅預訓練的檢查點,採用深度窄型策略優化,適用於英語 NLP 任務,需要微調後才能實際使用。

模型特點

深度窄型架構
優先增加模型深度而非寬度,優化下游任務性能。
高效預訓練
在 C4 數據集上預訓練,使用跨度的掩碼語言建模目標。
參數高效
相比同等參數量的其他架構,在性能上更具優勢。

模型能力

文本生成
文本摘要
問答系統
文本分類

使用案例

文本處理
文本摘要
生成輸入文本的簡潔摘要。
問答系統
根據上下文回答問題。
分類任務
文本分類
對文本進行分類。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase