T

T5 Efficient Base Ff6000

Developed by google
T5-Efficient-BASE-FF6000是谷歌原版T5的一个变体,采用深度窄型架构,在参数数量相近的模型架构中,下游任务性能更具优势。
Downloads 16
Release Time : 3/2/2022

Model Overview

这是一个仅预训练的检查点,基于T5模型架构,采用深度窄型设计策略,优先增加模型深度以提高效率。

Model Features

深度窄型架构
优先增加模型深度而非宽度,在相同参数数量下提供更好的下游任务性能
高效预训练
在Colossal Cleaned Common Crawl (C4)数据集上进行预训练,使用跨度的掩码语言建模目标
参数优化
前馈网络维度设置为6000,相比标准T5-base的3072更大

Model Capabilities

文本生成
文本摘要
问答系统
文本分类(需微调)

Use Cases

文本生成
内容摘要
对长文档生成简洁摘要
问答系统
开放域问答
基于给定文本回答问题
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase