A

Acemath RL Nemotron 7B GGUF

Mungertによって開発
AceMath-RL-Nemotron-7Bは、完全に強化学習によって訓練された数学的推論モデルです。Deepseek-R1-Distilled-Qwen-7Bをベースに訓練され、数学的推論タスクで優れた性能を発揮し、同時にコーディングタスクにも一定の汎化能力を持っています。
ダウンロード数 633
リリース時間 : 5/10/2025

モデル概要

このモデルは、数学的推論に特化した強化学習訓練モデルで、さまざまなハードウェアとメモリの要件に対応するために複数の量子化形式を提供します。

モデル特徴

強化学習訓練
完全に強化学習によって訓練され、数学的推論タスクで優れた性能を発揮します。
汎化能力が高い
数学的推論の訓練と同時に、コーディングタスクにおけるモデルの精度を向上させます。
複数の量子化形式
さまざまなハードウェアとメモリの要件に対応するために、複数の量子化形式を提供します。
精度適応型量子化
超低ビットモデルに精度適応型量子化を導入し、メモリ効率を維持しながら精度を保持します。

モデル能力

数学的推論
コーディングタスク
テキスト生成

使用事例

数学問題の解決
確率計算
宝くじの当選確率計算など、複雑な確率問題を解決します。
AIME 2024や2025などの数学競技で優れた成績を収めています。
コーディングタスク
コード生成
コード断片を生成したり、プログラミング問題を解決します。
LiveCodeBenchで良好な成績を収めています。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase