N

Nvidia OpenReasoning Nemotron 7B GGUF

bartowskiによって開発
NVIDIA OpenReasoning-Nemotron-7Bモデルの量子化バージョンで、llama.cppツールを使用して量子化処理を行い、さまざまなハードウェアでの実行効率とパフォーマンスを向上させます。
ダウンロード数 933
リリース時間 : 7/18/2025

モデル概要

このプロジェクトは、NVIDIA OpenReasoning-Nemotron-7Bモデルの複数の量子化バージョンを提供し、さまざまなハードウェア構成に適しており、推論速度とメモリ使用量の最適化を目的としています。

モデル特徴

複数の量子化オプション
Q8_0からQ2_Kまでの複数の量子化レベルを提供し、さまざまなハードウェアとパフォーマンスの要件を満たします。
ハードウェア互換性の最適化
ARMおよびAVX CPU推論のオンライン再パッケージングをサポートし、特定のハードウェアでのパフォーマンスを向上させます。
高品質な推論
一部の量子化バージョン(例:Q6_K_L)は、元のモデルに近い推論品質を維持します。
柔軟なデプロイメント
LM Studio、llama.cppおよびllama.cppベースのプロジェクトでの実行をサポートします。

モデル能力

テキスト生成
論理推論
複数回の対話
プロンプトエンジニアリング

使用事例

研究と開発
モデルパフォーマンステスト
特定のハードウェアでのさまざまな量子化レベルのパフォーマンスをテストします。
詳細な量子化レベルとパフォーマンスの比較データを提供します
アプリケーションデプロイメント
ローカル推論サービス
リソースが制限されたデバイスで高効率なテキスト生成サービスをデプロイします。
メモリ使用量を削減しながら許容可能な生成品質を維持します
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase