gemma-3-12b-it-Q8_0-GGUF開源模型 - 適配llama.cpp框架應用超便利

首頁

Gemma 3 12b It Q8 0 GGUF

由NikolayKozloff開發

該模型是從google/gemma-3-12b-it轉換而來的GGUF格式模型，適用於llama.cpp框架。

大型語言模型 #高精度量化 #長文本推理 #多輪對話優化

下載量 89

發布時間 : 3/12/2025

模型概述

基於Google Gemma模型轉換的GGUF格式模型，主要用於文本生成任務，支持在llama.cpp框架下高效運行。

模型特點

高效量化

採用Q8_0量化級別，在保持模型性能的同時減少資源佔用

llama.cpp兼容

專為llama.cpp框架優化，可在多種硬件上高效運行

輕量部署

GGUF格式便於在各種環境中部署和使用

模型能力

文本生成

對話系統

內容創作

使用案例

內容生成

創意寫作

生成故事、詩歌等創意文本內容

技術文檔

自動生成技術文檔和說明

對話系統

智能助手

構建對話式AI助手

屬性	詳情
基礎模型	google/gemma-3-12b-it
庫名稱	transformers
許可證	gemma
任務類型	圖像文本生成文本
標籤	llama-cpp, gguf-my-repo

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

智啟未來，您的人工智能解決方案智庫

Gemma 3 12b It Q8 0 GGUF

模型概述

模型特點

模型能力

使用案例

🚀 NikolayKozloff/gemma-3-12b-it-Q8_0-GGUF

🚀 快速開始

模型信息

訪問提示

📦 安裝指南

💻 使用示例

基礎用法

CLI方式

Server方式

高級用法

步驟1：從GitHub克隆llama.cpp

步驟2：進入llama.cpp文件夾並使用`LLAMA_CURL=1`標誌以及其他特定硬件標誌（例如，在Linux上使用Nvidia GPU時使用`LLAMA_CUDA=1`）進行編譯

步驟3：通過主二進制文件運行推理

📄 許可證

Gemma 3 12b It Q8 0 GGUF

模型概述

模型特點

模型能力

使用案例

🚀 NikolayKozloff/gemma-3-12b-it-Q8_0-GGUF

🚀 快速開始

模型信息

訪問提示

📦 安裝指南

💻 使用示例

基礎用法

CLI方式

Server方式

高級用法

步驟1：從GitHub克隆llama.cpp

步驟2：進入llama.cpp文件夾並使用LLAMA_CURL=1標誌以及其他特定硬件標誌（例如，在Linux上使用Nvidia GPU時使用LLAMA_CUDA=1）進行編譯

步驟3：通過主二進制文件運行推理

📄 許可證

步驟2：進入llama.cpp文件夾並使用`LLAMA_CURL=1`標誌以及其他特定硬件標誌（例如，在Linux上使用Nvidia GPU時使用`LLAMA_CUDA=1`）進行編譯