gemma-3-4b-pt-Q4_0-GGUF開源模型 - 免費支持各類文本生成任務

首頁

Gemma 3 4b Pt Q4 0 GGUF

由ngxson開發

這是一個基於Google Gemma 3.4B參數模型轉換的GGUF格式模型，適用於文本生成任務。

大型語言模型 #輕量級推理 #本地化部署 #中文文本生成

下載量 74

發布時間 : 3/14/2025

模型概述

該模型是通過llama.cpp從google/gemma-3-4b-pt轉換為GGUF格式的版本，主要用於文本生成任務。

模型特點

GGUF格式

使用GGUF格式，便於在llama.cpp生態系統中使用。

量化版本

提供Q4_0量化版本，降低資源需求。

Hugging Face集成

可通過Hugging Face平臺訪問，需同意Google使用許可。

模型能力

文本生成

對話系統

內容創作

使用案例

內容生成

創意寫作

生成故事、詩歌等創意內容

問答系統

回答用戶提出的各種問題

教育

學習輔助

幫助學生理解複雜概念

🚀 ngxson/gemma-3-4b-pt-Q4_0-GGUF

本項目將模型從 google/gemma-3-4b-pt 轉換為 GGUF 格式。轉換借助 llama.cpp，通過 ggml.ai 的 GGUF-my-repo 空間完成。如需瞭解該模型的更多詳細信息，請參考原始模型卡片。

🚀 快速開始

本模型可通過 llama.cpp 進行使用，以下為具體步驟。

📦 安裝指南

可通過 brew（適用於 Mac 和 Linux）安裝 llama.cpp：

brew install llama.cpp

💻 使用示例

基礎用法

可通過 CLI 或 Server 調用該模型。

CLI 調用

llama-cli --hf-repo ngxson/gemma-3-4b-pt-Q4_0-GGUF --hf-file gemma-3-4b-pt-q4_0.gguf -p "The meaning to life and the universe is"

Server 調用

llama-server --hf-repo ngxson/gemma-3-4b-pt-Q4_0-GGUF --hf-file gemma-3-4b-pt-q4_0.gguf -c 2048

高級用法

你也可以直接按照 Llama.cpp 倉庫中列出的使用步驟使用該檢查點，具體步驟如下：

步驟 1：從 GitHub 克隆 llama.cpp

git clone https://github.com/ggerganov/llama.cpp

步驟 2：進入 llama.cpp 文件夾並使用 `LLAMA_CURL=1` 標誌以及其他特定硬件標誌（例如，在 Linux 上使用英偉達 GPU 時使用 `LLAMA_CUDA=1`）進行編譯

cd llama.cpp && LLAMA_CURL=1 make

步驟 3：通過主二進制文件運行推理

./llama-cli --hf-repo ngxson/gemma-3-4b-pt-Q4_0-GGUF --hf-file gemma-3-4b-pt-q4_0.gguf -p "The meaning to life and the universe is"

或者

./llama-server --hf-repo ngxson/gemma-3-4b-pt-Q4_0-GGUF --hf-file gemma-3-4b-pt-q4_0.gguf -c 2048

📄 許可證

本項目使用的許可證為 gemma 許可證。

屬性	詳情
基礎模型	google/gemma-3-4b-pt
庫名稱	transformers
許可證	gemma
任務類型	圖像文本到文本
標籤	llama-cpp, gguf-my-repo

⚠️ 重要提示

要在 Hugging Face 上使用 Gemma，你需要查看並同意 Google 的使用許可。為此，請確保你已登錄 Hugging Face 並點擊下方按鈕。請求將立即處理。

💡 使用建議

可根據自身硬件情況，在編譯 llama.cpp 時添加特定硬件標誌，如在 Linux 上使用英偉達 GPU 時添加 LLAMA_CUDA=1 以加速推理。

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

智啟未來，您的人工智能解決方案智庫