# 8ビット量子化推論

Qwen3 30B A3B Gptq 8bit
Apache-2.0
Qwen3 30B A3BはGPTQメソッドを用いて8ビット量子化処理を施した大規模言語モデルで、効率的な推論シナリオに適しています。
大規模言語モデル Transformers
Q
btbtyler09
301
2
Josiefied Qwen3 8B Abliterated V1 8bit
Qwen3-8Bを最適化した8ビット量子化バージョン、MLXフレームワーク向けの効率的な推論に適応
大規模言語モデル
J
mlx-community
450
1
Kimi VL A3B Thinking 8bit
その他
Kimi-VL-A3B-Thinking-8bitは、MLX形式に変換されたマルチモーダル視覚言語モデルで、画像テキストからテキストへの生成タスクをサポートしています。
画像生成テキスト Transformers その他
K
mlx-community
1,738
1
Gemma 3 12b It Qat 8bit
その他
Google Gemma 3 12Bモデルを基に変換された8ビット量子化バージョンで、画像テキストからテキストへのタスクに適しています。
画像生成テキスト Transformers その他
G
mlx-community
149
1
Stable Diffusion 3.5 Large Turbo Openvino 8bit
その他
Stable Diffusion 3.5 Large Turboの8ビット量子化バージョンで、OpenVINO形式に変換され、効率的なテキストから画像生成タスクに使用されます。
テキスト生成画像 英語
S
AIFunOver
28
1
LLAMA 3 Quantized
MIT
Meta Llama 3 - 8B Instruct大規模言語モデルの8ビット量子化バージョン、モデルサイズを縮小し推論速度を向上、リソースが限られたデバイスでの展開に適しています。
大規模言語モデル Transformers
L
Kameshr
18
9
Meta Llama 3 8B Instruct Bnb 8bit
その他
これはMeta社のMeta-Llama-3-8B-Instructモデルの8ビット量子化バージョンで、bitsandbytesを使用して量子化されており、効率的なテキスト生成タスクに適しています。
大規模言語モデル Transformers
M
alokabhishek
2,310
2
Pinokio V1.0
Apache-2.0
Pinokio_v1.0 は英語とトルコ語をサポートするテキスト生成モデルで、Apache-2.0 ライセンスの下で公開されています。
大規模言語モデル Transformers 複数言語対応
P
Eurdem
2,810
4
Instructblip Flan T5 Xxl 8bit Nf4
MIT
InstructBLIPはBLIP-2の視覚的指示チューニングバージョンで、視覚と言語モデルを組み合わせ、画像とテキスト指示に基づいて説明を生成したり質問に答えたりできます。
画像生成テキスト Transformers 英語
I
Mediocreatmybest
22
1
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase