モデル選定

因果言語モデル

# 因果言語モデル

ProGen2-xlargeはNijkampらが提案した基礎モデルに基づき、設定と順伝播を変更したタンパク質生成モデルです。

大規模言語モデル

ProGen2-baseはNijkampらの研究に基づくタンパク質生成モデルで、タンパク質配列の生成と予測をサポートします。

大規模言語モデル

Myrrh Solar 10.7b 3.0

MoAData社によって開発された医療分野の大規模言語モデルで、DPO手法を用いて自社製の医療データセットで訓練されています。

大規模言語モデル

Transformers 韓国語

ProGen2-smallはNijkampらの研究に基づくタンパク質生成モデルで、軽微な設定調整とフォワードプロパゲーション処理を施したミラー版です。

大規模言語モデル

Mambaは、transformersと互換性のある高効率シーケンスモデルで、7.9億のパラメータを持ち、因果言語モデリングタスクに適しています。

大規模言語モデル

vortex-3bはOEvortexによって開発された27.8億パラメータの因果言語モデルで、Pythia-2.8bモデルをベースにVortex-50kデータセットでファインチューニングされています。

大規模言語モデル

Transformers 英語

OpenCALMはCyberAgent社が開発した日本語データセットに基づく事前学習済みデコーダー専用言語モデルシリーズの3Bパラメータバージョンです。

大規模言語モデル

Transformers 日本語

Pythia-1BはEleutherAIが開発した解釈可能性研究専用の言語モデルで、Pythiaスイートの10億パラメータ規模バージョンであり、The Pileデータセットでトレーニングされています。

大規模言語モデル

Transformers 英語

Pythia-6.9BはEleutherAIが開発した大規模言語モデルで、Pythiaスケーラブルスイートの一部であり、解釈可能性研究を促進するために設計されています。

大規模言語モデル

Transformers 英語

PythiaはEleutherAIが開発した一連の因果言語モデルで、説明可能性研究のために設計されており、7000万から120億パラメータまでの8つのサイズを含み、154のトレーニングチェックポイントを提供します

大規模言語モデル

Transformers 英語

Pythia-28億はEleutherAIが開発したスケーラブルな言語モデルスイートの一員で、大規模言語モデルの解釈可能性研究を促進するために設計されています。このモデルはTransformerアーキテクチャに基づいており、The Pileデータセットでトレーニングされ、28億のパラメータを持っています。

大規模言語モデル

Transformers 英語

Pythia-1.4BはEleutherAIが開発した12億パラメータの因果言語モデルで、Pythiaスケールスイートの一部であり、解釈可能性研究のために設計されています。

大規模言語モデル

Transformers 英語

GPT-2アーキテクチャに基づくタイ語因果言語モデル、OSCARデータセットでトレーニング済み

大規模言語モデルその他

The Notorious Big

ノートリアス・ビッグ（The Notorious B.I.G.）の歌詞で微調整されたGPT - 2言語モデルで、同様のスタイルの歌詞テキストを生成できます。

大規模言語モデル英語

Gpt Neo 1.3B Vietnamese News

これはベトナムのニュースデータで訓練されたGPT-Neo 1.3Bパラメータ規模のベトナム語因果言語モデルです

大規模言語モデル

Transformers その他

Toolバンドの歌詞を基に訓練されたGPT - 2言語モデルで、類似したスタイルの歌詞テキストを生成できます。

大規模言語モデル英語

Skilletバンドの歌詞を基に微調整されたGPT - 2言語モデルで、同様のスタイルのテキスト内容を生成するために使用されます。

大規模言語モデル英語

GPT - Neo 1.3BはEleutherAIによって開発された13億パラメータの自己回帰型言語モデルで、GPT - 3アーキテクチャに基づいて設計され、テキスト生成タスクに長けています。

大規模言語モデル英語

Rugpt3medium Sum Gazeta

rugpt3medium_based_on_gpt2に基づくロシア語抽象要約生成モデルで、Gazetaデータセットに特化して訓練されています。

テキスト生成

Transformers その他

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

大規模言語モデル

Transformers 複数言語対応

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

対話システム

Transformers 英語

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

AIbase

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

© 2025AIbase