T

T5 Efficient Large Dm2000

Developed by google
T5高效大型-DM2000是谷歌T5模型的一个变体,采用深度窄型架构,优先增加模型深度以提高下游任务性能。
Downloads 16
Release Time : 3/2/2022

Model Overview

这是一个仅预训练的检查点,基于T5模型架构,采用深度窄型设计,旨在提高模型效率。需要在特定任务上进行微调后才能使用。

Model Features

深度窄型架构
优先增加模型深度而非宽度,相比参数数量相似的模型架构,对下游任务性能更有利
高效预训练
在C4数据集上进行了524288步的预训练,使用基于跨度的掩码语言建模目标
参数效率
通过深度窄型设计,在相同参数规模下提供更好的性能

Model Capabilities

文本生成
文本摘要
问答系统
文本分类

Use Cases

自然语言处理
文本摘要
将长文档压缩为简洁摘要
问答系统
基于给定文本回答问题
文本分类
对文本进行分类或标记
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase