D

Deepseek R1 0528 Qwen3 8B GPTQ Int4 Int8Mix

QuantTrioによって開発
DeepSeek-R1-0528-Qwen3-8Bをベースに開発された量子化バージョンのモデルで、推論能力や幻覚率の低減などの面で著しい向上が見られ、様々な自然言語処理タスクに適しています。
ダウンロード数 154
リリース時間 : 5/30/2025

モデル概要

このモデルは、計算リソースを増やし、アルゴリズムの最適化メカニズムを導入することで、推論の深度と推論能力を大幅に向上させ、数学、プログラミング、一般的な論理などの分野に適用できます。

モデル特徴

推論能力の強化
数学、プログラミング、一般的な論理などの様々なベンチマーク評価で優れた結果を示し、全体的な性能はリーディングモデルに近い水準です。
正解率の向上
AIME 2025テストでは、以前のバージョンの70%から現在のバージョンの87.5%に正解率が向上しました。
幻覚率の低減
モデルが幻覚を生み出す確率を低減しました。
関数呼び出しのサポート強化
関数呼び出しをより適切にサポートします。
コーディング体験の最適化
より良いコーディング体験を提供します。

モデル能力

テキスト生成
数学的推論
プログラミング支援
論理的推論
関数呼び出し

使用事例

数学
AIME 2025テスト
AIME 2025テストでは、正解率が87.5%に達しました。
正解率が70%から87.5%に向上しました。
プログラミング
LiveCodeBenchテスト
LiveCodeBench (2408 - 2505)テストでは、Pass@1が73.3%に達しました。
Pass@1が63.5%から73.3%に向上しました。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase