T

T5 Efficient Small Dm768

Developed by google
T5-Efficient-SMALL-DM768 是 Google 原始 T5 的一個變體,採用深度窄型架構,優先增加模型深度以提高下游性能。
Downloads 49
Release Time : 3/2/2022

Model Overview

這是一個僅預訓練的檢查點,採用深度窄型策略優化,適用於英語 NLP 任務,需要微調後才能實際使用。

Model Features

深度窄型架構
優先增加模型深度而非寬度,優化下游任務性能。
高效預訓練
在 C4 數據集上預訓練,使用跨度的掩碼語言建模目標。
參數高效
相比同等參數量的其他架構,在性能上更具優勢。

Model Capabilities

文本生成
文本摘要
問答系統
文本分類

Use Cases

文本處理
文本摘要
生成輸入文本的簡潔摘要。
問答系統
根據上下文回答問題。
分類任務
文本分類
對文本進行分類。
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase