T

T5 Efficient Small Nl22

googleによって開発
T5効率的小型-NL22はGoogleのT5モデルの深層ナロー変種で、モデルの深さを増やすことで下流タスクの性能向上に焦点を当てています。
ダウンロード数 17
リリース時間 : 3/2/2022

モデル概要

これは事前学習済みチェックポイントのみで、T5アーキテクチャに基づき、深層ナロー設計戦略を採用し、モデルの幅ではなく深さを優先的に増やすことで計算効率と下流タスク性能を向上させています。

モデル特徴

深層ナローアーキテクチャ
モデルの幅ではなく深さを優先的に増やし、研究によるとこのアーキテクチャは下流タスクでより効率的です。
効率的な事前学習
C4データセットで524,288ステップの事前学習を行い、スパン型マスク言語モデリング目標を使用しています。
パラメータ効率
同等パラメータ数の他のアーキテクチャと比較し、計算効率(パラメータ数、FLOPs、速度)で優れています。

モデル能力

テキスト生成
テキスト要約
質問応答システム
テキスト分類(ファインチューニング必要)

使用事例

テキスト生成
自動要約
長文書から簡潔な要約を生成
質問応答システム
オープンドメイン質問応答
与えられたテキストに基づいて質問に回答
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase