# GQA効率的推論

Llama 3.3 70b Instruct Awq
Llama 3.3はMetaが開発した多言語大規模言語モデルで、700億のパラメータを持ち、多言語対話ユースケースに最適化されており、多くのベンチマークテストで優れた性能を発揮します。
大規模言語モデル Transformers 複数言語対応
L
casperhansen
47.12k
32
Llama 3.2 1B Instruct QLORA INT4 EO8
Llama 3.2はMetaが発表した多言語大規模言語モデルシリーズで、1Bと3Bのパラメータを持つ事前学習と命令微調整バージョンが含まれ、8種類の公式言語をサポートし、多言語対話シーンを最適化しています。
大規模言語モデル PyTorch 複数言語対応
L
meta-llama
286
41
Llama 3.2 90B Vision Instruct
Llama 3.2-VisionはMetaが開発したマルチモーダル大規模言語モデルで、画像とテキストの入力、テキスト出力をサポートし、視覚認識、画像推論、画像説明、画像質問応答タスクで優れた性能を発揮します。
画像生成テキスト Transformers 複数言語対応
L
meta-llama
15.44k
337
Llama 3.1 Minitron 4B Width Base
その他
Llama-3.1-Minitron-4B-Width-Baseは、Llama-3.1-8Bをプルーニングして得られた基本的なテキストからテキストへのモデルで、さまざまな自然言語生成タスクに適しています。
大規模言語モデル Transformers 英語
L
nvidia
10.15k
190
Minitron 8B Base
その他
Minitron-8B-BaseはNemotron-4 15Bを剪裁して得られた大規模言語モデルで、蒸留継続訓練手法を採用し、ゼロから訓練する場合と比べて40倍の訓練トークンと1.8倍の計算コストを節約しました。
大規模言語モデル Transformers 英語
M
nvidia
5,725
66
Llama 3.1 8B
Meta Llama 3.1は多言語大規模言語モデルシリーズで、8B、70B、405Bの3つの規模の事前学習及び指示チューニング生成モデルを含み、多言語対話シナリオに最適化されています。
大規模言語モデル Transformers 複数言語対応
L
meta-llama
1.0M
1,583
Meta Llama 3 70B
MetaがリリースしたLlama 3シリーズの大規模言語モデルで、8Bと70Bの2つの規模の事前学習および命令調整済み生成テキストモデルを含み、対話シナリオに最適化されており、業界ベンチマークで優れた性能を発揮します。
大規模言語モデル Transformers 英語
M
meta-llama
15.32k
857
Llama 2 70b Chat Hf
Metaがオープンソース化した700億パラメータの対話最適化大規模言語モデルで、安全性と実用性において主要なクローズドソースモデルに匹敵
大規模言語モデル Transformers 英語
L
meta-llama
34.78k
2,187
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase