T

T5 Efficient Base Nl48

googleによって開発
T5-Efficient-BASE-NL48 は Google T5 のバリエーションで、深度狭幅アーキテクチャを採用し、下流タスクの性能向上のためにモデルの深さを優先的に増やしています。
ダウンロード数 14
リリース時間 : 3/2/2022

モデル概要

このモデルは T5 アーキテクチャに基づく事前学習チェックポイントで、深度狭幅設計戦略を採用し、英語テキストで事前学習されており、微調整が必要な英語の自然言語処理(NLP)タスクに適しています。

モデル特徴

深度狭幅アーキテクチャ
モデルの幅ではなく深さ(48 層)を優先的に増やし、パラメータ数が近い他のアーキテクチャと比較して下流タスクでより良い性能を発揮します。
効率的な事前学習
C4 データセットで 524288 ステップのスパンマスク言語モデリングの事前学習を行いました。
柔軟な微調整
事前学習チェックポイントとして、微調整により様々な英語の NLP タスクに適応させることができます。

モデル能力

テキスト生成
テキスト要約
質問応答システム
テキスト分類

使用事例

テキスト処理
ニュース要約生成
微調整後、ニュース記事の簡潔な要約を自動生成するために使用できます。
オープンドメイン質問応答
微調整により、様々な質問に回答できる質問応答システムを構築できます。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase