T

T5 Efficient Base Ff6000

googleによって開発
T5-Efficient-BASE-FF6000はGoogleのオリジナルT5のバリエーションで、深度狭幅アーキテクチャを採用しており、パラメータ数が近いモデルアーキテクチャの中で、下流タスクの性能に優れています。
ダウンロード数 16
リリース時間 : 3/2/2022

モデル概要

これは事前学習のみのチェックポイントで、T5モデルアーキテクチャに基づき、深度狭幅設計戦略を採用し、モデルの深度を優先的に増やして効率を向上させています。

モデル特徴

深度狭幅アーキテクチャ
モデルの幅ではなく深度を優先的に増やし、同じパラメータ数でより良い下流タスクの性能を提供します。
効率的な事前学習
Colossal Cleaned Common Crawl (C4)データセットで事前学習を行い、スパンのマスク言語モデリング目標を使用します。
パラメータ最適化
フィードフォワードネットワークの次元を6000に設定し、標準のT5-baseの3072よりも大きくしています。

モデル能力

テキスト生成
テキスト要約
質問応答システム
テキスト分類(微調整が必要)

使用事例

テキスト生成
内容要約
長いドキュメントから簡潔な要約を生成します。
質問応答システム
オープンドメイン質問応答
与えられたテキストに基づいて質問に答えます。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase