Ko En Llama2 13b
LLaMA2-13Bアーキテクチャに基づく韓英バイリンガル自己回帰型言語モデルで、韓国語コーパスの学習に重点を置きつつ英語能力を維持
大規模言語モデル
Transformers 韓国語

K
hyunseoki
1,850
27
Molm 700M 4B
Apache-2.0
MoLMは混合エキスパート(MoE)アーキテクチャに基づく言語モデルシリーズで、700M-4Bバージョンは総パラメータ数40億、計算コストは7億パラメータの密モデル相当
大規模言語モデル
Transformers

M
ibm-research
36
6
Gpt2 Zinc 87m
MIT
GPT2スタイルの自己回帰型言語モデルで、薬類似分子の生成やSMILES文字列からの埋め込み表現生成に特化
分子モデル
Transformers

G
entropy
404
3
Polyglot Ko 12.8b
Apache-2.0
Polyglot-Ko-12.8BはEleutherAIの多言語チームによって開発された大規模な韓国語自己回帰型言語モデルで、12.8億のパラメータを持ち、韓国語に特化して最適化されています。
大規模言語モデル
Transformers 韓国語

P
EleutherAI
732
82
Polyglot Ko 5.8b
Apache-2.0
Polyglot-Ko-5.8BはEleutherAIの多言語チームによって開発された大規模な韓国語自己回帰型言語モデルで、58億のパラメータを持ち、863GBの韓国語データでトレーニングされています。
大規模言語モデル
Transformers 韓国語

P
EleutherAI
1,148
65
Polyglot Ko 1.3b
Apache-2.0
Polyglot-KoはEleutherAI多言語チームによって開発された韓国語自己回帰型言語モデルシリーズの一つで、13億のパラメータを含み、韓国語に特化して最適化されています。
大規模言語モデル
Transformers 韓国語

P
EleutherAI
121.13k
83
Codegen 16B Mono
Bsd-3-clause
CodeGen-Mono 16Bは、プログラム合成のための自己回帰型言語モデルで、英語のプロンプトから実行可能なコードを生成することに特化しています。
大規模言語モデル
Transformers

C
Salesforce
227
126
Ko Gpt Trinity 1.2B V0.5
GPT-3アーキテクチャに基づく12億パラメータの韓国語Transformerモデルで、SKテレコムが開発し、主に韓国語テキスト生成と理解タスクに使用されます。
大規模言語モデル
Transformers 韓国語

K
skt
1,294
44
Gpt2 Finetuned Greek
Apache-2.0
英語のGPT - 2モデルをベースに微調整されたギリシャ語テキスト生成モデルで、ギリシャ軍事学院とクレタ工科大学が共同開発しました。
大規模言語モデル その他
G
lighteternal
178
7
Xglm 7.5B
MIT
XGLM-7.5Bは75億のパラメータを持つ多言語自己回帰型言語モデルで、30種以上の言語をサポートし、5000億のサブワードトークンの多様なコーパスで訓練されています。
大規模言語モデル
Transformers 複数言語対応

X
facebook
1,260
57
GPT Neo 2.7B Picard
MIT
GPT-Neo 2.7Bを微調整したSFテーマの言語モデルで、SF系テキストの生成に長けています。
大規模言語モデル
Transformers 英語

G
KoboldAI
40
7
GPT Neo 2.7B Janeway
MIT
GPT - Neo 2.7Bをベースに微調整されたSF/ファンタジーテーマの言語モデル
大規模言語モデル
Transformers 英語

G
KoboldAI
93
6
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98