T

T5 Efficient Base

googleによって開発
T5 - Efficient - BASEはGoogleのT5アーキテクチャをベースにしたバリエーションで、深度狭型設計を採用して下流タスクの性能を最適化し、パラメータ数は2億2290万です。
ダウンロード数 735
リリース時間 : 3/2/2022

モデル概要

このモデルは元のT5アーキテクチャの改良版で、モデルの幅ではなく深度を優先的に増やすことで効率を向上させ、英語のNLPタスクに適しています。微調整が必要です。

モデル特徴

深度狭型アーキテクチャ
標準のT5と比較して、モデルの幅ではなく深度を優先的に増やし、同じパラメータ数で下流タスクの性能を向上させます。
効率的な事前学習
C4データセットで524,288ステップの事前学習を行い、スパンのマスク言語モデリング目標を採用しています。
パラメータ効率の最適化
高く細い設計により、より良いパレート効率を実現し、パラメータ数、FLOPs、推論速度をバランスさせます。

モデル能力

テキスト生成
テキスト要約
質問応答システム
テキスト分類(アーキテクチャの調整が必要)

使用事例

テキスト生成
自動要約生成
長い文書を簡潔な要約に圧縮します。
質問応答システム
オープンドメイン質問応答
与えられたコンテキストに基づいて自然言語の質問に回答します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase