G

Google Gemma 3 1b It Qat GGUF

由bartowski開發
基於Google Gemma 3B QAT權重的多種量化版本,適用於本地推理部署
下載量 1,437
發布時間 : 4/19/2025

模型概述

該模型是Google Gemma-3-1B指令調優模型的量化版本集合,使用llama.cpp的imatrix方法進行優化量化,支持多種精度級別以適應不同硬件環境

模型特點

量化感知訓練優化
基於Google官方QAT權重,相比傳統量化方法具有更好的精度保持
多精度選擇
提供從BF16到2bit的20種量化選項,滿足不同硬件需求
ARM兼容性
特定量化版本(Q4_0等)支持ARM CPU在線重打包推理
imatrix優化
使用llama.cpp的imatrix功能進行數據感知量化,提升低bit量化質量

模型能力

指令跟隨
多輪對話
文本補全
知識問答

使用案例

本地部署應用
個人助手
在本地設備運行個性化AI助手
低延遲響應,保護隱私
教育工具
離線環境下的學習輔導和問答系統
邊緣計算
移動端推理
在手機等移動設備上運行AI功能
優化後的量化模型降低硬件要求
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase