🚀 KnutJaegersberg/gemma-3-27b-it-abliterated-Q8_0-GGUF
本項目將模型轉換為GGUF格式,解決了特定模型在特定格式下的使用問題,為用戶提供了更便捷的模型使用體驗。該模型從mlabonne/gemma-3-27b-it-abliterated
轉換而來,藉助llama.cpp和ggml.ai的GGUF-my-repo空間完成格式轉換。
🚀 快速開始
本模型是從mlabonne/gemma-3-27b-it-abliterated
使用llama.cpp通過ggml.ai的GGUF-my-repo空間轉換為GGUF格式的。有關該模型的更多詳細信息,請參考原始模型卡片。
📦 安裝指南
通過brew安裝llama.cpp(適用於Mac和Linux)
brew install llama.cpp
💻 使用示例
基礎用法
CLI方式:
llama-cli --hf-repo KnutJaegersberg/gemma-3-27b-it-abliterated-Q8_0-GGUF --hf-file gemma-3-27b-it-abliterated-q8_0.gguf -p "The meaning to life and the universe is"
服務器方式:
llama-server --hf-repo KnutJaegersberg/gemma-3-27b-it-abliterated-Q8_0-GGUF --hf-file gemma-3-27b-it-abliterated-q8_0.gguf -c 2048
高級用法
你也可以直接通過Llama.cpp倉庫中列出的使用步驟來使用此檢查點。
步驟1:從GitHub克隆llama.cpp。
git clone https://github.com/ggerganov/llama.cpp
步驟2:進入llama.cpp文件夾,並使用LLAMA_CURL=1
標誌以及其他特定硬件標誌(例如,在Linux上使用Nvidia GPU時使用LLAMA_CUDA=1
)進行編譯。
cd llama.cpp && LLAMA_CURL=1 make
步驟3:通過主二進制文件運行推理。
./llama-cli --hf-repo KnutJaegersberg/gemma-3-27b-it-abliterated-Q8_0-GGUF --hf-file gemma-3-27b-it-abliterated-q8_0.gguf -p "The meaning to life and the universe is"
或者
./llama-server --hf-repo KnutJaegersberg/gemma-3-27b-it-abliterated-Q8_0-GGUF --hf-file gemma-3-27b-it-abliterated-q8_0.gguf -c 2048
📄 許可證
本模型使用gemma許可證。
屬性 |
詳情 |
基礎模型 |
mlabonne/gemma-3-27b-it-abliterated |
庫名稱 |
transformers |
許可證 |
gemma |
任務類型 |
圖像文本到文本 |
標籤 |
llama-cpp, gguf-my-repo |