G

Gemma 3 12b It GPTQ 4b 128g

由ISTA-DASLab開發
該模型是對google/gemma-3-12b-it進行INT4量化的版本,通過GPTQ算法將參數從16比特降至4比特,顯著減少了磁盤空間和GPU內存需求。
下載量 1,175
發布時間 : 4/11/2025

模型概述

基於Gemma-3-12b-it的INT4量化版本,適用於文本生成和多模態任務,保持了原模型大部分性能的同時顯著降低資源需求。

模型特點

高效INT4量化
採用GPTQ算法將參數從16比特降至4比特,減少約75%的存儲和內存需求。
性能保留
在OpenLLM基準測試中保持了原模型98.42%的性能表現。
多模態支持
支持圖像和文本的聯合處理,能夠理解並描述圖像內容。

模型能力

文本生成
圖像內容理解
多模態任務處理
對話系統

使用案例

內容生成
圖像描述生成
根據輸入圖像生成詳細描述
能準確識別圖像中的物體和場景並生成流暢描述
智能助手
多模態對話
結合圖像和文本輸入進行對話
能理解圖像內容並回答相關問題
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase