T

T5 Efficient Small Dm768

googleによって開発
T5-Efficient-SMALL-DM768 は Google のオリジナル T5 のバリエーションで、ディープナローアーキテクチャを採用し、下流タスクの性能向上のためにモデルの深さを優先的に増やしています。
ダウンロード数 49
リリース時間 : 3/2/2022

モデル概要

これは事前学習のみのチェックポイントで、ディープナロー戦略で最適化されており、英語の NLP タスクに適していますが、実際に使用するにはファインチューニングが必要です。

モデル特徴

ディープナローアーキテクチャ
モデルの幅ではなく深さを優先的に増やし、下流タスクの性能を最適化します。
効率的な事前学習
C4 データセットで事前学習され、スパンを用いたマスク言語モデリング目標が使用されています。
パラメータ効率
同等のパラメータ数の他のアーキテクチャと比較して、性能面で優位性があります。

モデル能力

テキスト生成
テキスト要約
質問応答システム
テキスト分類

使用事例

テキスト処理
テキスト要約
入力テキストの簡潔な要約を生成します。
質問応答システム
コンテキストに基づいて質問に答えます。
分類タスク
テキスト分類
テキストを分類します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase