T

T5 Efficient Base Nl48

Developed by google
T5-Efficient-BASE-NL48 は Google T5 のバリエーションで、深度狭幅アーキテクチャを採用し、下流タスクの性能向上のためにモデルの深さを優先的に増やしています。
Downloads 14
Release Time : 3/2/2022

Model Overview

このモデルは T5 アーキテクチャに基づく事前学習チェックポイントで、深度狭幅設計戦略を採用し、英語テキストで事前学習されており、微調整が必要な英語の自然言語処理(NLP)タスクに適しています。

Model Features

深度狭幅アーキテクチャ
モデルの幅ではなく深さ(48 層)を優先的に増やし、パラメータ数が近い他のアーキテクチャと比較して下流タスクでより良い性能を発揮します。
効率的な事前学習
C4 データセットで 524288 ステップのスパンマスク言語モデリングの事前学習を行いました。
柔軟な微調整
事前学習チェックポイントとして、微調整により様々な英語の NLP タスクに適応させることができます。

Model Capabilities

テキスト生成
テキスト要約
質問応答システム
テキスト分類

Use Cases

テキスト処理
ニュース要約生成
微調整後、ニュース記事の簡潔な要約を自動生成するために使用できます。
オープンドメイン質問応答
微調整により、様々な質問に回答できる質問応答システムを構築できます。
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase