モデル選定

エンコーダ-デコーダアーキテクチャ

# エンコーダ-デコーダアーキテクチャ

T0++はT5アーキテクチャに基づく自然言語処理モデルで、マルチタスクプロンプトトレーニングによりゼロショットタスク汎化能力を実現し、多くのNLPタスクでGPT-3を上回りながらよりコンパクトです。

大規模言語モデル

Transformers 英語

MrT5はByT5を改良した効率的なバイトレベルの言語モデルで、動的トークン統合技術により入力シーケンス長を約50%短縮

大規模言語モデル

Transformers 複数言語対応

TURNAはトルコ語のエンコーダ-デコーダ言語モデルで、理解と生成能力の強化に焦点を当てています。

大規模言語モデル

Comprehend It Multilingual T5 Base

mT5-baseベースの多言語ゼロショット分類モデルで、約100言語の双方向テキスト分類をサポート

テキスト分類

Transformers 複数言語対応

Pile-T5基本版はT5xライブラリを使用し、The Pileデータセットで訓練されたエンコーダ-デコーダモデルで、MLM目標で200万ステップ、約2兆トークン訓練されています。

大規模言語モデル

Transformers 英語

MedICapは医療画像説明生成のエンコーダ-デコーダモデルで、ImageCLEFmedical Caption 2023チャレンジで優勝しました。

画像生成テキスト

Pile-T5 Large は T5x ライブラリを使用し、The Pile データセットでトレーニングされたエンコーダ-デコーダモデルで、主に英語のテキストからテキストを生成するタスクに使用されます。

大規模言語モデル

Transformers 英語

T5 Small Wikilingua Vietnamese

Transformerエンコーダ-デコーダアーキテクチャに基づくベトナム語最先端軽量事前学習モデル、テキスト要約タスクに特化。

テキスト生成

Transformers その他

Bert2bert Turkish Paraphrase Generation

Bert2Bertアーキテクチャに基づくトルコ語の言い換え生成モデルで、意味は同じだが表現が異なる文章を生成します。

テキスト生成

Transformers その他

Wav2vec2 Large Xlsr 53 German Gpt2

これはMOZILLA-FOUNDATION/COMMON_VOICE_7_0ドイツ語データセットでトレーニングされた自動音声認識エンコーダ-デコーダモデルで、Wav2Vec2とGPT2アーキテクチャの利点を組み合わせています。

Transformers ドイツ語

Bert Mini2bert Mini Finetuned Cnn Daily Mail Summarization

これはBERT-miniアーキテクチャに基づくエンコーダ-デコーダモデルで、CNN/Dailymailデータセットに特化してファインチューニングされ、テキスト要約生成タスク用に設計されています。

テキスト生成

Transformers 英語

ruT5-baseはSberDevicesによって開発されたロシア語テキスト生成モデルで、T5アーキテクチャを基にし、2億2200万のパラメータと300GBのトレーニングデータ量を持ちます。

大規模言語モデル

Transformers その他

Roberta2roberta L 24 Cnn Daily Mail

RoBERTa-Largeで初期化されたエンコーダ-デコーダモデルで、要約生成タスク向けに設計され、CNN/DailyMailデータセットでファインチューニングされています。

テキスト生成

Transformers 英語

T0++は、英語の自然言語プロンプトでゼロショットタスク汎化能力を示すエンコーダ-デコーダモデルで、多くのタスクでGPT-3を上回りながら、サイズは16分の1です。

大規模言語モデル

Transformers 英語

T0ppはT5アーキテクチャに基づく110億パラメータのエンコーダ-デコーダモデルで、英語自然言語プロンプトのゼロショットタスク汎化において優れた性能を発揮し、GPT-3を上回りながらもよりコンパクトなサイズを実現しています。

大規模言語モデル

Transformers 英語

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

大規模言語モデル

Transformers 複数言語対応

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

対話システム

Transformers 英語

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

AIbase

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

© 2025AIbase