T

T5 Efficient Xl

googleによって開発
T5効率的XLはGoogleのT5モデルの深層ナロー変種で、モデルの幅ではなく深さを増やすことで下流タスクの性能を向上させることに焦点を当てています。
ダウンロード数 63
リリース時間 : 3/2/2022

モデル概要

これは事前学習のみのチェックポイントで、深層ナローアーキテクチャ設計を採用しており、Transformerブロックの数を増やすことでモデル性能を最適化することを目的としています。

モデル特徴

深層ナローアーキテクチャ
モデルの幅ではなく深さを優先的に増やし、同等パラメータ数の他のアーキテクチャと比べて下流タスクに有利
効率的な事前学習
C4データセットで524288ステップの事前学習を行い、スパンを用いたマスク言語モデリング目標を使用
パラメータ最適化
フル精度では約11406.62 MBのメモリを必要とし、半精度では約5703.31 MBのメモリを必要とする

モデル能力

テキスト生成
テキスト要約
質問応答システム
テキスト分類(微調整が必要)

使用事例

テキスト処理
自動要約生成
長文書を自動的に簡潔な要約に圧縮
質問応答システム
与えられたテキストに基づいてユーザーの質問に回答
コンテンツ生成
テキスト継続
プロンプトに基づいて一貫性のある続きのテキストを生成
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase