D

Deepseek R1 0528 Qwen3 8B GPTQ Int4 Int8Mix

Developed by QuantTrio
DeepSeek-R1-0528-Qwen3-8Bをベースに開発された量子化バージョンのモデルで、推論能力や幻覚率の低減などの面で著しい向上が見られ、様々な自然言語処理タスクに適しています。
Downloads 154
Release Time : 5/30/2025

Model Overview

このモデルは、計算リソースを増やし、アルゴリズムの最適化メカニズムを導入することで、推論の深度と推論能力を大幅に向上させ、数学、プログラミング、一般的な論理などの分野に適用できます。

Model Features

推論能力の強化
数学、プログラミング、一般的な論理などの様々なベンチマーク評価で優れた結果を示し、全体的な性能はリーディングモデルに近い水準です。
正解率の向上
AIME 2025テストでは、以前のバージョンの70%から現在のバージョンの87.5%に正解率が向上しました。
幻覚率の低減
モデルが幻覚を生み出す確率を低減しました。
関数呼び出しのサポート強化
関数呼び出しをより適切にサポートします。
コーディング体験の最適化
より良いコーディング体験を提供します。

Model Capabilities

テキスト生成
数学的推論
プログラミング支援
論理的推論
関数呼び出し

Use Cases

数学
AIME 2025テスト
AIME 2025テストでは、正解率が87.5%に達しました。
正解率が70%から87.5%に向上しました。
プログラミング
LiveCodeBenchテスト
LiveCodeBench (2408 - 2505)テストでは、Pass@1が73.3%に達しました。
Pass@1が63.5%から73.3%に向上しました。
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase