T

T5 Efficient Base Ff9000

googleによって開発
T5-Efficient-BASE-FF9000はGoogleのオリジナル版T5のバリエーションで、深度狭型アーキテクチャを採用しており、パラメータ規模が似ている場合でも、下流タスクでの性能がより優れています。
ダウンロード数 16
リリース時間 : 3/2/2022

モデル概要

これはT5アーキテクチャに基づく事前学習モデルで、深度狭型の設計戦略を採用し、モデルの深度を優先的に増やすことで効率を向上させています。モデルは英語のC4データセットで事前学習されており、様々な英語のNLPタスクに適用可能です。

モデル特徴

深度狭型アーキテクチャ
高くて細い(深くて狭い)モデル設計を採用しており、基礎モデルよりも効率的で、パラメータ数、FLOPs、速度の3つの重要な効率指標で優れた性能を発揮します。
効率的な事前学習
大規模なクリーン版Common Crawl(C4)データセットで524288ステップの事前学習を行い、スパンのマスク言語モデリング目標を使用します。
柔軟な微調整
基礎モデルとして、様々な下流タスク(要約生成、質問応答システム、テキスト分類など)に対して微調整することができます。

モデル能力

テキスト生成
テキスト要約
質問応答システム
テキスト分類

使用事例

テキスト生成
自動要約
長い文書を自動的に簡潔な要約に変換します。
質問応答システム
オープンドメイン質問応答
与えられたテキストに基づいてユーザーの質問に回答します。
テキスト分類
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase