T

T5 Efficient Large Nh32

Developed by google
T5高效大型-NH32是谷歌T5模型的深度窄型變體,專注於通過增加模型深度提升下游任務性能。
Downloads 16
Release Time : 3/2/2022

Model Overview

該模型是基於T5架構的預訓練檢查點,採用深度窄型設計策略,優先增加模型深度而非寬度,以提高參數效率。

Model Features

深度窄型架構
採用32層深度設計,相比同等參數規模的傳統架構更高效
參數高效
通過優化深度與寬度的比例,在相同參數數量下獲得更好的性能
預訓練基礎
在C4數據集上進行大規模預訓練,提供強大的語言理解能力

Model Capabilities

文本生成
文本摘要
問答系統
文本分類
機器翻譯

Use Cases

文本處理
文檔摘要
將長文檔自動壓縮為簡潔摘要
問答系統
基於給定文本回答用戶問題
內容生成
文本改寫
保持語義不變的情況下重寫文本
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase