DeepSeek-R1-ReDistill-Qwen-7B-v1.1-Q8_0-GGUF开源模型

首页

Deepseek R1 ReDistill Qwen 7B V1.1 Q8 0 GGUF

由 NikolayKozloff 开发

该模型是基于DeepSeek-R1-ReDistill-Qwen-7B-v1.1转换的GGUF格式模型，适用于文本生成任务。

大型语言模型开源协议:MIT #量化推理优化 #中文文本生成 #轻量级部署

下载量 44

发布时间 : 1/30/2025

模型简介

该模型是一个经过重新蒸馏的7B参数大语言模型，支持文本生成任务，适用于多种自然语言处理应用。

模型特点

GGUF格式

模型已转换为GGUF格式，便于通过llama.cpp进行高效推理。

重新蒸馏

基于DeepSeek-R1-ReDistill-Qwen-7B-v1.1模型，经过重新蒸馏优化。

量化版本

提供Q8_0量化版本，平衡了模型大小和推理精度。

模型能力

文本生成

自然语言理解

使用案例

自然语言处理

开放文本生成

根据提示生成连贯的文本内容

问答系统

基于知识库回答用户问题

🚀 NikolayKozloff/DeepSeek-R1-ReDistill-Qwen-7B-v1.1-Q8_0-GGUF

本模型通过 llama.cpp 借助 ggml.ai 的 GGUF-my-repo 空间，从 mobiuslabsgmbh/DeepSeek-R1-ReDistill-Qwen-7B-v1.1 转换为 GGUF 格式。有关该模型的更多详细信息，请参考原始模型卡片。

🚀 快速开始

✨ 主要特性

模型类型：文本生成
基础模型：mobiuslabsgmbh/DeepSeek-R1-ReDistill-Qwen-7B-v1.1
训练状态：未进行训练
推理状态：支持推理

属性	详情
模型类型	文本生成
基础模型	mobiuslabsgmbh/DeepSeek-R1-ReDistill-Qwen-7B-v1.1
训练状态	未训练
推理状态	支持推理
许可证	MIT

📦 安装指南

使用 Homebrew 安装 llama.cpp（适用于 Mac 和 Linux）

brew install llama.cpp

💻 使用示例

与 llama.cpp 结合使用

命令行界面（CLI）

llama-cli --hf-repo NikolayKozloff/DeepSeek-R1-ReDistill-Qwen-7B-v1.1-Q8_0-GGUF --hf-file deepseek-r1-redistill-qwen-7b-v1.1-q8_0.gguf -p "The meaning to life and the universe is"

服务器模式

llama-server --hf-repo NikolayKozloff/DeepSeek-R1-ReDistill-Qwen-7B-v1.1-Q8_0-GGUF --hf-file deepseek-r1-redistill-qwen-7b-v1.1-q8_0.gguf -c 2048

直接使用 Llama.cpp 仓库中的使用步骤

步骤 1：从 GitHub 克隆 llama.cpp

git clone https://github.com/ggerganov/llama.cpp

步骤 2：进入 llama.cpp 文件夹并使用 `LLAMA_CURL=1` 标志以及其他特定硬件标志（例如，在 Linux 上使用英伟达 GPU 时使用 `LLAMA_CUDA=1`）进行编译

cd llama.cpp && LLAMA_CURL=1 make

步骤 3：通过主二进制文件运行推理

./llama-cli --hf-repo NikolayKozloff/DeepSeek-R1-ReDistill-Qwen-7B-v1.1-Q8_0-GGUF --hf-file deepseek-r1-redistill-qwen-7b-v1.1-q8_0.gguf -p "The meaning to life and the universe is"

或者

./llama-server --hf-repo NikolayKozloff/DeepSeek-R1-ReDistill-Qwen-7B-v1.1-Q8_0-GGUF --hf-file deepseek-r1-redistill-qwen-7b-v1.1-q8_0.gguf -c 2048

⚠️ 重要提示

你也可以直接通过 Llama.cpp 仓库中列出的使用步骤使用此检查点。

📄 许可证

本项目采用 MIT 许可证。

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

智启未来，您的人工智能解决方案智库