DeepSeek-R1-ReDistill-Qwen-7B-v1.1-Q8_0-GGUFオープンソースモデル - テキスト生成タスクに無料で利用可能

ホーム

Deepseek R1 ReDistill Qwen 7B V1.1 Q8 0 GGUF

NikolayKozloffによって開発

このモデルはDeepSeek-R1-ReDistill-Qwen-7B-v1.1を変換したGGUF形式モデルで、テキスト生成タスクに適しています。

大規模言語モデルオープンソースライセンス:MIT #量子化推論最適化 #中国語テキスト生成 #軽量展開

ダウンロード数 44

リリース時間 : 1/30/2025

モデル概要

このモデルは再蒸留された7Bパラメータの大規模言語モデルで、テキスト生成タスクをサポートし、様々な自然言語処理アプリケーションに適用可能です。

モデル特徴

GGUF形式

モデルはGGUF形式に変換されており、llama.cppによる効率的な推論が可能です。

再蒸留

DeepSeek-R1-ReDistill-Qwen-7B-v1.1モデルを基に、再蒸留による最適化が施されています。

量子化バージョン

Q8_0量子化バージョンを提供し、モデルサイズと推論精度のバランスを取っています。

モデル能力

テキスト生成

自然言語理解

使用事例

自然言語処理

オープンテキスト生成

プロンプトに基づいて一貫性のあるテキストコンテンツを生成

質問応答システム

ナレッジベースに基づいてユーザーの質問に回答

🚀 NikolayKozloff/DeepSeek-R1-ReDistill-Qwen-7B-v1.1-Q8_0-GGUF

このモデルは、mobiuslabsgmbh/DeepSeek-R1-ReDistill-Qwen-7B-v1.1 から、llama.cpp を使用して ggml.ai の GGUF-my-repo スペース経由で GGUF 形式に変換されました。モデルの詳細については、元のモデルカードを参照してください。

🚀 クイックスタート

このモデルを使用するには、以下の手順に従ってください。

📦 インストール

llama.cpp のインストール

llama.cpp を brew を通じてインストールします（Mac と Linux で動作します）。

brew install llama.cpp

💻 使用例

基本的な使用法

CLI を使用する場合

llama-cli --hf-repo NikolayKozloff/DeepSeek-R1-ReDistill-Qwen-7B-v1.1-Q8_0-GGUF --hf-file deepseek-r1-redistill-qwen-7b-v1.1-q8_0.gguf -p "The meaning to life and the universe is"

サーバーを使用する場合

llama-server --hf-repo NikolayKozloff/DeepSeek-R1-ReDistill-Qwen-7B-v1.1-Q8_0-GGUF --hf-file deepseek-r1-redistill-qwen-7b-v1.1-q8_0.gguf -c 2048

高度な使用法

Llama.cpp リポジトリに記載されている使用手順を直接使用することもできます。

ステップ 1: llama.cpp を GitHub からクローンする

git clone https://github.com/ggerganov/llama.cpp

ステップ 2: llama.cpp フォルダに移動し、`LLAMA_CURL=1` フラグとその他のハードウェア固有のフラグ（例: Linux の Nvidia GPU の場合は LLAMA_CUDA=1）でビルドする

cd llama.cpp && LLAMA_CURL=1 make

ステップ 3: メインバイナリを通じて推論を実行する

./llama-cli --hf-repo NikolayKozloff/DeepSeek-R1-ReDistill-Qwen-7B-v1.1-Q8_0-GGUF --hf-file deepseek-r1-redistill-qwen-7b-v1.1-q8_0.gguf -p "The meaning to life and the universe is"

または

./llama-server --hf-repo NikolayKozloff/DeepSeek-R1-ReDistill-Qwen-7B-v1.1-Q8_0-GGUF --hf-file deepseek-r1-redistill-qwen-7b-v1.1-q8_0.gguf -c 2048

📄 ライセンス

このモデルは MIT ライセンスの下で提供されています。

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご