T

T5 Efficient Xl

Developed by google
T5効率的XLはGoogleのT5モデルの深層ナロー変種で、モデルの幅ではなく深さを増やすことで下流タスクの性能を向上させることに焦点を当てています。
Downloads 63
Release Time : 3/2/2022

Model Overview

これは事前学習のみのチェックポイントで、深層ナローアーキテクチャ設計を採用しており、Transformerブロックの数を増やすことでモデル性能を最適化することを目的としています。

Model Features

深層ナローアーキテクチャ
モデルの幅ではなく深さを優先的に増やし、同等パラメータ数の他のアーキテクチャと比べて下流タスクに有利
効率的な事前学習
C4データセットで524288ステップの事前学習を行い、スパンを用いたマスク言語モデリング目標を使用
パラメータ最適化
フル精度では約11406.62 MBのメモリを必要とし、半精度では約5703.31 MBのメモリを必要とする

Model Capabilities

テキスト生成
テキスト要約
質問応答システム
テキスト分類(微調整が必要)

Use Cases

テキスト処理
自動要約生成
長文書を自動的に簡潔な要約に圧縮
質問応答システム
与えられたテキストに基づいてユーザーの質問に回答
コンテンツ生成
テキスト継続
プロンプトに基づいて一貫性のある続きのテキストを生成
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase