# 効率的な量子化デプロイ

Mistralai Mistral Small 3.2 24B Instruct 2506 GGUF
Apache-2.0
これはMistral-Small-3.2-24B-Instruct-2506モデルのLlamacpp imatrix量子化バージョンで、さまざまな量子化タイプを提供して、異なるハードウェアの要件を満たします。
大規模言語モデル 複数言語対応
M
bartowski
3,769
12
Nvidia OpenMath Nemotron 14B Kaggle GGUF
これはNVIDIAがオープンソースで公開した14Bパラメータの数学用大規模言語モデルで、llama.cppを用いて量子化処理され、様々なハードウェア条件下で効率的に動作します。
大規模言語モデル 英語
N
bartowski
432
1
Llama 4 Scout 17B 16E Instruct GGUF
その他
Llama-4-Scout-17B-16E-Instruct-GGUFは、Llama-4-Scout-17B-16E-Instructモデルに基づく量子化バージョンで、多言語処理をサポートし、チャットや命令タスクに適しています。
大規模言語モデル Transformers 複数言語対応
L
gaianet
2,263
0
Meta Llama Llama 4 Scout 17B 16E Instruct Old GGUF
その他
Llama-4-Scout-17B-16E-InstructはMetaがリリースした17Bパラメータの命令微調整大規模言語モデルで、量子化処理を行って実行効率を向上させています。
大規模言語モデル 複数言語対応
M
bartowski
3,142
30
Dolphin3.0 Llama3.2 1B GGUF
Llama3.2アーキテクチャに基づく1Bパラメータ量子化モデル、テキスト生成タスクをサポート、様々な量子化バージョン選択に対応
大規模言語モデル 英語
D
bartowski
1,134
4
Qwen2 VL 7B GGUF
Apache-2.0
Qwen2-VL-7Bは視覚言語モデルで、複数の量子化バージョンのGGUF形式のモデルファイルを提供し、llama.cppでの使用に適しています。
テキスト生成画像 Transformers 英語
Q
tensorblock
108
1
Mixtral 8x22B Instruct V0.1 GGUF
Apache-2.0
mistralai/Mixtral-8x22B-Instruct-v0.1モデルに基づくGGUF量子化バージョンで、多言語テキスト生成タスクをサポートします。
大規模言語モデル 複数言語対応
M
MaziyarPanahi
1,333
33
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase