D

Deepseek R1 0528 AWQ

adamo1139によって開発
DeepSeek - R1 - 0528 671Bモデルの4ビットAWQ量子化バージョンで、ハイエンドGPUノードでの使用に適しています。
ダウンロード数 161
リリース時間 : 5/31/2025

モデル概要

これはDeepSeek - R1 - 0528 671Bモデルの4ビットAWQ量子化バージョンで、vLLMとSGLangを組み合わせて、8xA100/8xH20/8xH100などのGPUノードで使用するのに適しています。

モデル特徴

高性能推論
数学、プログラミング、一般的な論理などの様々なベンチマーク評価で優れた性能を発揮し、全体的な性能はO3やGemini 2.5 Proなどの最先端モデルに近いです。
量子化最適化
4ビットAWQ量子化技術を使用して、モデルの実行時のメモリ要件を削減しながら、高い性能を維持します。
推論深度の強化
後期学習におけるアルゴリズム最適化メカニズムにより、推論深度と推論能力が大幅に向上しました。
幻覚率の低減
前のバージョンと比較して、新しいバージョンは幻覚率を低減し、より正確な回答を提供します。

モデル能力

複雑な数学問題の解決
プログラムコードの生成
論理推論
複数ラウンドの対話
ファイル内容の分析
ウェブ検索結果の統合

使用事例

教育
数学コンテスト問題の解答
AIME、HMMTなどの数学コンテストの問題を解答します。
AIME 2025テストでの正解率は87.5%に達しました。
プログラミング
コード生成と最適化
プログラミングコードを生成し、最適化します。
LiveCodeBenchテストでのPass@1は73.3%に達しました。
研究
学術研究支援
研究者が文献レビューやデータ分析を行うのを支援します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase