# 量子化推論

Llama 3.2 1B Instruct GGUF
Llama-3.2-1B-Instruct は Llama アーキテクチャに基づく 1B パラメータの命令微調整モデルで、さまざまなハードウェアニーズに対応するために複数の量子化フォーマットを提供します。
大規模言語モデル 複数言語対応
L
Mungert
708
3
Mxbai Rerank Large V2 GGUF
Apache-2.0
mxbai-rerank-large-v2は多言語テキストリランキングモデルで、複数の言語と量子化フォーマットをサポートし、様々なハードウェア環境に適しています。
テキスト埋め込み 複数言語対応
M
Mungert
2,209
2
Gemma 3 4b Novision
Gemma-3-4b純テキストモデルは、google/gemma-3-4b-itから変換された純テキストバージョンで、ビジュアルコンポーネントを削除し、テキスト生成タスクに特化しています。
大規模言語モデル Transformers
G
gghfez
40.57k
2
Gemmax2 28 2B 4bit
Apache-2.0
GemmaX2-28-2B GGUF量子化モデルはXiaomiが開発したGemmaX2-28-2B-v0.1翻訳大規模言語モデルの量子化バージョンコレクションで、28言語の機械翻訳タスクをサポートします。
機械翻訳 Transformers 複数言語対応
G
Tonic
19
1
Whisperkit Pro
その他
WhisperKit ProはWhisperKitの商用版で、自動音声認識(ASR)タスクに特化し、量子化技術をサポートし、効率的な音声処理に適しています。
音声認識
W
argmaxinc
1,862
14
Chinese Llama 2 7b Gguf
Apache-2.0
llama.cpp用に適応された中国語LLaMA-2-7BモデルのGGUF-v3バージョンファイル
大規模言語モデル Transformers 複数言語対応
C
hfl
254
5
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase