N

Nvidia Llama 3.1 Nemotron Nano 4B V1.1 GGUF

bartowskiによって開発
NVIDIA Llama-3.1-Nemotron-Nano-4B-v1.1モデルを基にした量子化バージョンで、llama.cppツールを使用して様々な量子化処理が施されており、リソースが限られた環境での実行に適しています。
ダウンロード数 2,553
リリース時間 : 5/20/2025

モデル概要

これは4Bパラメータ規模の大規模言語モデルで、モデルサイズを縮小しつつ高い推論品質を維持するために様々な量子化処理が行われています。英語のテキスト生成タスクをサポートします。

モデル特徴

様々な量子化オプション
BF16からQ2_Kまで様々な量子化バージョンを提供し、異なるハードウェアと性能ニーズに対応
埋め込み/出力重みの最適化
一部の量子化バージョン(Q3_K_XL、Q4_K_Lなど)では埋め込みと出力重みにQ8_0量子化を使用し、品質を向上
ARM/AVX最適化
オンライン再パッキング機能をサポートし、ARMおよびAVXハードウェア上での実行性能を最適化
広範な互換性
LM Studio、llama.cppおよびllama.cppを基にしたあらゆるプロジェクトで実行可能

モデル能力

英語テキスト生成
対話システム
コンテンツ作成

使用事例

対話システム
インテリジェントアシスタント
英語の対話型インテリジェントアシスタントを構築
自然な英語の対話を理解し生成できる
コンテンツ作成
テキスト生成
様々なタイプの英語テキストコンテンツを生成
一貫性があり論理的な英語文章を生成可能
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase