Bonsai
盆栽は5億パラメータの小型三値重み付け言語モデルで、LlamaアーキテクチャとMistralトークナイザーを使用し、トレーニングに使用されたトークン数は50億未満です。
大規模言語モデル
Transformers

B
deepgrove
113
8
Linglong 317M
Gpl-3.0
LingLongは軽量級の中国語事前学習言語モデルで、GPT-3アーキテクチャに基づいて構築されており、パラメータ規模は3.17億で、計算リソースが限られている研究者に適しています。
大規模言語モデル
Transformers 複数言語対応

L
AlumiK
27
2
Mythomax L2 13b Q4 K M GGUF
その他
MythoMax L2 13bはQ4_K_M量子化バージョンに基づく大規模言語モデルで、テキスト生成タスクに適しています。
大規模言語モデル 英語
M
Clevyby
1,716
2
Fietje 2
MIT
Fietje 2はmicrosoft/phi-2を基にしたオランダ語最適化バージョンで、280億オランダ語トークンで訓練され、オランダ語テキスト生成能力を特別に向上させています
大規模言語モデル
Transformers その他

F
BramVanroy
230
9
Uform Gen2 Qwen 500m
Apache-2.0
UForm-Genは小型の生成的視覚言語モデルで、主に画像キャプション生成と視覚的質問応答に使用されます。
画像生成テキスト
Transformers 英語

U
unum-cloud
17.98k
76
Tinymistral 248M GGUF
Apache-2.0
TinyMistral-248MはMistral 7Bモデルを基に事前学習された小型言語モデルで、パラメータ規模は約2.48億に縮小されており、主に下流タスクのファインチューニングに使用されます。
大規模言語モデル 英語
T
afrideva
211
5
Billsum Tiny Summarization
Apache-2.0
google/t5-efficient-tinyをファインチューニングしたテキスト要約モデルで、billsumデータセットでトレーニング済み
テキスト生成
Transformers

B
jotamunz
932
1
Tinyllama 1.1B Step 50K 105b
Apache-2.0
TinyLlamaは1.1BパラメータのLlamaモデルで、3兆トークンの事前学習を計画しており、最適化により16台のA100-40G GPUで90日以内に学習を完了できます。
大規模言語モデル
Transformers 英語

T
TinyLlama
14.41k
133
Tinystories 1M ONNX
TinyStories-1M-ONNXはONNX形式の小型言語モデルで、テキスト生成タスクに適しています。
大規模言語モデル
Transformers 英語

T
mkly
63
2
Rubert Tiny Squad
MIT
cointegrated/rubert-tiny2をファインチューニングしたロシア語Q&Aモデル、SQuAD形式の質問応答タスクに適応
質問応答システム
Transformers

R
Den4ikAI
32
0
Tmp Trainer
このモデルは未知のデータセットでスクラッチから訓練されましたが、具体的な情報や用途はまだ不明です。
大規模言語モデル
Transformers

T
Mahmoud1816Yasser
20
0
Distilroberta Base Model Transcript
Apache-2.0
distilroberta-baseモデルをファインチューニングしたテキスト処理モデルで、汎用NLPタスクに適しています
大規模言語モデル
Transformers

D
mahaamami
14
0
Distilbert Base Uncased Finetuned Emotion Test 01
Apache-2.0
DistilBERTに基づく軽量級テキスト感情分類モデルで、emotionデータセットで微調整されました。
テキスト分類
Transformers

D
lewtun
15
0
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98