Gemma 3.4B IT開源大語言模型 - 免費使用實現多樣文本交互與內容輸出

首頁

Gemma 3 4b It Q4 K M GGUF

由DravenBlack開發

Gemma 3.4B IT 是由 Google 開發的開源大語言模型，此版本為通過 llama.cpp 轉換為 GGUF 格式的 4-bit 量化版本。

大型語言模型 #量化輕量版 #本地化部署 #多輪對話優化

下載量 186

發布時間 : 3/14/2025

模型概述

基於 Google 原始 Gemma 3.4B 指令調優模型的量化版本，適用於本地部署和推理任務。

模型特點

高效量化

採用 Q4_K_M 量化技術，在保持模型性能的同時顯著減少內存佔用

本地部署

GGUF 格式支持通過 llama.cpp 在各種硬件上本地運行

指令調優

經過指令調優，能更好地理解和執行用戶指令

模型能力

文本生成

對話系統

內容創作

問答系統

使用案例

內容生成

創意寫作

生成故事、詩歌等創意文本內容

技術文檔

自動生成或完善技術文檔

智能助手

聊天機器人

構建本地運行的對話式AI助手

🚀 PolymerX/gemma-3-4b-it-Q4_K_M-GGUF

本項目將模型從 google/gemma-3-4b-it 轉換為 GGUF 格式。藉助 llama.cpp 並通過 ggml.ai 的 GGUF-my-repo 空間完成轉換。若需瞭解該模型的更多詳細信息，請參考原始模型卡片。

🚀 快速開始

本模型可與 llama.cpp 結合使用，以下是詳細的使用步驟。

📦 安裝指南

可通過 brew（適用於 Mac 和 Linux）安裝 llama.cpp：

brew install llama.cpp

💻 使用示例

基礎用法

安裝完成後，你可以通過命令行界面（CLI）或服務器模式調用該模型。

CLI 模式：

llama-cli --hf-repo PolymerX/gemma-3-4b-it-Q4_K_M-GGUF --hf-file gemma-3-4b-it-q4_k_m.gguf -p "The meaning to life and the universe is"

服務器模式：

llama-server --hf-repo PolymerX/gemma-3-4b-it-Q4_K_M-GGUF --hf-file gemma-3-4b-it-q4_k_m.gguf -c 2048

高級用法

你也可以直接按照 Llama.cpp 倉庫中列出的使用步驟來使用此檢查點。

步驟 1：從 GitHub 克隆 llama.cpp

git clone https://github.com/ggerganov/llama.cpp

步驟 2：進入 llama.cpp 文件夾並使用 `LLAMA_CURL=1` 標誌以及其他特定硬件標誌（例如，在 Linux 上使用英偉達 GPU 時使用 `LLAMA_CUDA=1`）進行編譯

cd llama.cpp && LLAMA_CURL=1 make

步驟 3：通過主二進制文件運行推理

./llama-cli --hf-repo PolymerX/gemma-3-4b-it-Q4_K_M-GGUF --hf-file gemma-3-4b-it-q4_k_m.gguf -p "The meaning to life and the universe is"

或者

./llama-server --hf-repo PolymerX/gemma-3-4b-it-Q4_K_M-GGUF --hf-file gemma-3-4b-it-q4_k_m.gguf -c 2048

📄 許可證

本項目使用的許可證為 gemma。

🔍 模型信息

屬性	詳情
基礎模型	google/gemma-3-4b-it
庫名稱	transformers
許可證	gemma
任務類型	圖像文本到文本
標籤	llama-cpp, gguf-my-repo

⚠️ 重要提示

若要在 Hugging Face 上使用 Gemma，你需要查看並同意 Google 的使用許可。請確保你已登錄 Hugging Face 並點擊下方按鈕，請求將立即處理。

💡 使用建議

點擊下方按鈕以確認許可：Acknowledge license

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

智啟未來，您的人工智能解決方案智庫