DeepSeek-R1-ReDistill-Qwen-7B-v1.1-Q8_0-GGUF開源模型

首頁

Deepseek R1 ReDistill Qwen 7B V1.1 Q8 0 GGUF

由NikolayKozloff開發

該模型是基於DeepSeek-R1-ReDistill-Qwen-7B-v1.1轉換的GGUF格式模型，適用於文本生成任務。

大型語言模型開源協議:MIT #量化推理優化 #中文文本生成 #輕量級部署

下載量 44

發布時間 : 1/30/2025

模型概述

該模型是一個經過重新蒸餾的7B參數大語言模型，支持文本生成任務，適用於多種自然語言處理應用。

模型特點

GGUF格式

模型已轉換為GGUF格式，便於通過llama.cpp進行高效推理。

重新蒸餾

基於DeepSeek-R1-ReDistill-Qwen-7B-v1.1模型，經過重新蒸餾優化。

量化版本

提供Q8_0量化版本，平衡了模型大小和推理精度。

模型能力

文本生成

自然語言理解

使用案例

自然語言處理

開放文本生成

根據提示生成連貫的文本內容

問答系統

基於知識庫回答用戶問題

🚀 NikolayKozloff/DeepSeek-R1-ReDistill-Qwen-7B-v1.1-Q8_0-GGUF

本模型通過 llama.cpp 藉助 ggml.ai 的 GGUF-my-repo 空間，從 mobiuslabsgmbh/DeepSeek-R1-ReDistill-Qwen-7B-v1.1 轉換為 GGUF 格式。有關該模型的更多詳細信息，請參考原始模型卡片。

🚀 快速開始

✨ 主要特性

模型類型：文本生成
基礎模型：mobiuslabsgmbh/DeepSeek-R1-ReDistill-Qwen-7B-v1.1
訓練狀態：未進行訓練
推理狀態：支持推理

屬性	詳情
模型類型	文本生成
基礎模型	mobiuslabsgmbh/DeepSeek-R1-ReDistill-Qwen-7B-v1.1
訓練狀態	未訓練
推理狀態	支持推理
許可證	MIT

📦 安裝指南

使用 Homebrew 安裝 llama.cpp（適用於 Mac 和 Linux）

brew install llama.cpp

💻 使用示例

與 llama.cpp 結合使用

命令行界面（CLI）

llama-cli --hf-repo NikolayKozloff/DeepSeek-R1-ReDistill-Qwen-7B-v1.1-Q8_0-GGUF --hf-file deepseek-r1-redistill-qwen-7b-v1.1-q8_0.gguf -p "The meaning to life and the universe is"

服務器模式

llama-server --hf-repo NikolayKozloff/DeepSeek-R1-ReDistill-Qwen-7B-v1.1-Q8_0-GGUF --hf-file deepseek-r1-redistill-qwen-7b-v1.1-q8_0.gguf -c 2048

直接使用 Llama.cpp 倉庫中的使用步驟

步驟 1：從 GitHub 克隆 llama.cpp

git clone https://github.com/ggerganov/llama.cpp

步驟 2：進入 llama.cpp 文件夾並使用 `LLAMA_CURL=1` 標誌以及其他特定硬件標誌（例如，在 Linux 上使用英偉達 GPU 時使用 `LLAMA_CUDA=1`）進行編譯

cd llama.cpp && LLAMA_CURL=1 make

步驟 3：通過主二進制文件運行推理

./llama-cli --hf-repo NikolayKozloff/DeepSeek-R1-ReDistill-Qwen-7B-v1.1-Q8_0-GGUF --hf-file deepseek-r1-redistill-qwen-7b-v1.1-q8_0.gguf -p "The meaning to life and the universe is"

或者

./llama-server --hf-repo NikolayKozloff/DeepSeek-R1-ReDistill-Qwen-7B-v1.1-Q8_0-GGUF --hf-file deepseek-r1-redistill-qwen-7b-v1.1-q8_0.gguf -c 2048

⚠️ 重要提示

你也可以直接通過 Llama.cpp 倉庫中列出的使用步驟使用此檢查點。

📄 許可證

本項目採用 MIT 許可證。

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

智啟未來，您的人工智能解決方案智庫