D

Deepseek R1 GGUF

unslothによって開発
DeepSeek-R1はUnslothによって最適化された1.58ビット動的量子化大規模言語モデルで、MoEアーキテクチャを採用し、英語タスク処理をサポート
ダウンロード数 2.0M
リリース時間 : 1/20/2025

モデル概要

DeepSeek-R1の量子化バージョンで、Unslothの1.58ビット+2ビット動的量子化技術により効率的な推論を実現、特にMoE層の量子化戦略を最適化

モデル特徴

動的混合量子化
1.58ビット+2ビット動的量子化技術を採用、MoE層に対して選択的量子化を実施、標準1ビット/2ビット方式より精度優位
多バージョン量子化サポート
1.58ビットから2.51ビットまでの4種類の量子化方式を提供、ディスク使用量と推論精度のバランスを考慮
GPUアクセラレーション最適化
llama.cppによるGPU層オフロードをサポート、RTX 4090などのデバイスで高速推論を実現

モデル能力

英語テキスト生成
命令追従
コード理解と生成

使用事例

開発支援
コード生成
自然言語記述に基づきPythonなどのプログラミング言語コードを生成
Flappy Birdゲーム実装コード生成能力の例示
コンテンツ作成
技術文書翻訳
中英技術文書の相互翻訳処理
特定のプロンプトテンプレートを使用した構造化翻訳をサポート
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase