N

Nvidia OpenReasoning Nemotron 1.5B GGUF

bartowskiによって開発
NVIDIA OpenReasoning - Nemotron - 1.5Bの量子化バージョンで、llama.cppツールを通じて最適化され、さまざまなハードウェアでの実行効率とパフォーマンスが向上します。
ダウンロード数 660
リリース時間 : 7/18/2025

モデル概要

これは15億パラメータ規模の推論モデルで、量子化処理が施され、さまざまなハードウェア環境に適しており、特に推論効率とパフォーマンスの最適化に重点が置かれています。

モデル特徴

複数の量子化タイプ
bf16、Q8_0、Q6_K_Lなど、豊富な量子化タイプを提供し、さまざまなパフォーマンスと品質の要件を満たします。
高効率実行
一部の量子化バージョンはARMおよびAVXマシン向けに最適化されており、オンラインでの重みの再パッケージングによりパフォーマンスが向上します。
柔軟なダウンロード
huggingface-cliを使用して特定のファイルまたはモデルのブランチ全体をダウンロードすることができます。
最適化された推論
imatrixオプションと特定のデータセットを使用して量子化を行い、推論パフォーマンスを最適化します。

モデル能力

テキスト生成
推論タスクの処理
複数のハードウェアとの互換性のある実行

使用事例

汎用推論
対話システム
対話システムの構築に使用でき、複数回の対話をサポートします。
テキスト生成
首尾一貫した、論理的なテキスト内容を生成します。
研究開発
モデル量子化研究
さまざまな量子化方法がモデルのパフォーマンスに与える影響を研究します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase