G

Gemma 3 4b It Quantized W4A16

由abhishekchohan開發
Gemma 3是Google開發的輕量級開源大語言模型,本倉庫提供其4B參數版本的W4A16量化模型,顯著降低硬件需求。
下載量 592
發布時間 : 3/17/2025

模型概述

基於Gemma 3指令調優模型的4位權重量化版本,適用於消費級硬件部署,保持良好性能的同時減少內存佔用。

模型特點

高效量化
採用W4A16量化技術,權重量化至4位精度,激活值保持16位精度,顯著降低內存需求。
指令調優
經過指令調優優化,能更好地理解和執行自然語言指令。
消費級硬件適配
量化後模型更適合在消費級GPU和CPU上運行,降低部署門檻。

模型能力

自然語言理解
文本生成
指令執行
對話交互

使用案例

智能助手
聊天機器人
構建響應迅速、理解力強的對話系統
流暢自然的對話體驗
內容生成
文本創作
輔助寫作、內容摘要等任務
高質量文本輸出
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase