G

Google Gemma 3 4b It Qat GGUF

bartowskiによって開発
Google QAT重み量子化に基づくGemma 3Bモデルで、複数の量子化レベルをサポートし、リソースが限られた環境での効率的な推論に適しています。
ダウンロード数 4,538
リリース時間 : 4/18/2025

モデル概要

これはGoogle Gemma 3Bモデルの量子化バージョンで、量子化対応トレーニング(QAT)技術を使用して生成され、llama.cppツールによるimatrix量子化処理を経ており、BF16から極低ビットレートまでの多様な量子化オプションを提供します。特にコンシューマーグレードのハードウェアでの実行に適しています。

モデル特徴

量子化対応トレーニング(QAT)
Google公式のQAT重みに基づいて生成されており、トレーニング後の量子化と比較してより良いモデル性能を維持できます
多様な量子化オプション
BF16から極低ビットレート(Q2_K)までの20以上の量子化バージョンを提供し、さまざまなハードウェア要件に対応します
ARMアーキテクチャ最適化
一部の量子化バージョンはARMプロセッサ向けに特別に最適化されており、オンライン重み再構成をサポートします
imatrix量子化強化
llama.cppのimatrixオプションを使用して量子化を行い、専用データセットに基づいて量子化効果を最適化します

モデル能力

テキスト生成
対話システム
指示追従
コンテンツ作成

使用事例

ローカルAIアプリケーション
パーソナルアシスタント
ローカルデバイスでインテリジェントな対話アシスタントを実行
低遅延応答、プライバシー保護
コンテンツ作成
執筆支援とクリエイティブ生成
高品質なテキスト出力
研究開発
量子化技術研究
異なる量子化方法がモデル性能に与える影響を比較
複数の量子化バージョンを提供して比較
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase