Progen2 Xlarge
Bsd-3-clause
ProGen2-xlargeはNijkampらが提案した基礎モデルに基づき、設定と順伝播を変更したタンパク質生成モデルです。
大規模言語モデル
Transformers

P
hugohrban
38
1
Progen2 Base
Bsd-3-clause
ProGen2-baseはNijkampらの研究に基づくタンパク質生成モデルで、タンパク質配列の生成と予測をサポートします。
大規模言語モデル
Transformers

P
hugohrban
4,937
3
Myrrh Solar 10.7b 3.0
Apache-2.0
MoAData社によって開発された医療分野の大規模言語モデルで、DPO手法を用いて自社製の医療データセットで訓練されています。
大規模言語モデル
Transformers 韓国語

M
MoaData
15.39k
3
Progen2 Small
Bsd-3-clause
ProGen2-smallはNijkampらの研究に基づくタンパク質生成モデルで、軽微な設定調整とフォワードプロパゲーション処理を施したミラー版です。
大規模言語モデル
Transformers

P
hugohrban
6,505
2
Mamba 790m Hf
Mambaは、transformersと互換性のある高効率シーケンスモデルで、7.9億のパラメータを持ち、因果言語モデリングタスクに適しています。
大規模言語モデル
Transformers

M
state-spaces
6,897
4
Vortex 3b
その他
vortex-3bはOEvortexによって開発された27.8億パラメータの因果言語モデルで、Pythia-2.8bモデルをベースにVortex-50kデータセットでファインチューニングされています。
大規模言語モデル
Transformers 英語

V
OEvortex
16
5
Open Calm 3b
OpenCALMはCyberAgent社が開発した日本語データセットに基づく事前学習済みデコーダー専用言語モデルシリーズの3Bパラメータバージョンです。
大規模言語モデル
Transformers 日本語

O
cyberagent
850
20
Pythia 1b
Apache-2.0
Pythia-1BはEleutherAIが開発した解釈可能性研究専用の言語モデルで、Pythiaスイートの10億パラメータ規模バージョンであり、The Pileデータセットでトレーニングされています。
大規模言語モデル
Transformers 英語

P
EleutherAI
79.69k
38
Pythia 6.9b
Apache-2.0
Pythia-6.9BはEleutherAIが開発した大規模言語モデルで、Pythiaスケーラブルスイートの一部であり、解釈可能性研究を促進するために設計されています。
大規模言語モデル
Transformers 英語

P
EleutherAI
46.72k
54
Pythia 410m
Apache-2.0
PythiaはEleutherAIが開発した一連の因果言語モデルで、説明可能性研究のために設計されており、7000万から120億パラメータまでの8つのサイズを含み、154のトレーニングチェックポイントを提供します
大規模言語モデル
Transformers 英語

P
EleutherAI
83.28k
25
Pythia 2.8b
Apache-2.0
Pythia-28億はEleutherAIが開発したスケーラブルな言語モデルスイートの一員で、大規模言語モデルの解釈可能性研究を促進するために設計されています。このモデルはTransformerアーキテクチャに基づいており、The Pileデータセットでトレーニングされ、28億のパラメータを持っています。
大規模言語モデル
Transformers 英語

P
EleutherAI
40.38k
30
Pythia 1.4b
Apache-2.0
Pythia-1.4BはEleutherAIが開発した12億パラメータの因果言語モデルで、Pythiaスケールスイートの一部であり、解釈可能性研究のために設計されています。
大規模言語モデル
Transformers 英語

P
EleutherAI
60.98k
23
Gpt2 Base Thai
MIT
GPT-2アーキテクチャに基づくタイ語因果言語モデル、OSCARデータセットでトレーニング済み
大規模言語モデル その他
G
flax-community
1,026
10
The Notorious Big
ノートリアス・ビッグ(The Notorious B.I.G.)の歌詞で微調整されたGPT - 2言語モデルで、同様のスタイルの歌詞テキストを生成できます。
大規模言語モデル 英語
T
huggingartists
16
0
Gpt Neo 1.3B Vietnamese News
これはベトナムのニュースデータで訓練されたGPT-Neo 1.3Bパラメータ規模のベトナム語因果言語モデルです
大規模言語モデル
Transformers その他

G
VietAI
990
28
Tool
Toolバンドの歌詞を基に訓練されたGPT - 2言語モデルで、類似したスタイルの歌詞テキストを生成できます。
大規模言語モデル 英語
T
huggingartists
14
1
Skillet
Skilletバンドの歌詞を基に微調整されたGPT - 2言語モデルで、同様のスタイルのテキスト内容を生成するために使用されます。
大規模言語モデル 英語
S
huggingartists
24
0
Gpt Neo 1.3B
MIT
GPT - Neo 1.3BはEleutherAIによって開発された13億パラメータの自己回帰型言語モデルで、GPT - 3アーキテクチャに基づいて設計され、テキスト生成タスクに長けています。
大規模言語モデル 英語
G
EleutherAI
208.93k
298
Rugpt3medium Sum Gazeta
Apache-2.0
rugpt3medium_based_on_gpt2に基づくロシア語抽象要約生成モデルで、Gazetaデータセットに特化して訓練されています。
テキスト生成
Transformers その他

R
IlyaGusev
1,228
4
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98