G

Google Gemma 3 4b It Qat GGUF

由bartowski開發
基於Google QAT權重量化的Gemma 3B模型,支持多種量化級別,適用於資源受限環境下的高效推理。
下載量 4,538
發布時間 : 4/18/2025

模型概述

這是Google Gemma 3B模型的量化版本,採用量化感知訓練(QAT)技術生成,通過llama.cpp工具進行imatrix量化處理,提供從BF16到極低比特率的多種量化選項,特別適合在消費級硬件上運行。

模型特點

量化感知訓練(QAT)
基於Google官方QAT權重生成,相比後訓練量化能保持更好的模型性能
多樣化量化選項
提供從BF16到極低比特率(Q2_K)的20+種量化版本,滿足不同硬件需求
ARM架構優化
部分量化版本特別優化ARM處理器,支持在線權重重組
imatrix量化增強
使用llama.cpp的imatrix選項進行量化,基於專門數據集優化量化效果

模型能力

文本生成
對話系統
指令跟隨
內容創作

使用案例

本地AI應用
個人助手
在本地設備上運行智能對話助手
低延遲響應,保護隱私
內容創作
輔助寫作和創意生成
高質量文本輸出
研究開發
量化技術研究
比較不同量化方法對模型性能的影響
提供多種量化版本對比
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase