L

Llama 3.1 Nemotron Nano 4B V1.1 GGUF

Mungertによって開発
Llama-3.1-Nemotron-Nano-4B-v1.1は、Llama 3.1をベースに最適化された大規模言語モデルで、精度と効率のバランスが良好で、AIエージェントやチャットボットなどの様々なシーンに適しています。
ダウンロード数 2,177
リリース時間 : 5/21/2025

モデル概要

このモデルはNVIDIAが開発した4Bパラメータの大規模言語モデルで、128Kのコンテキスト長をサポートし、推論、チャット、RAG、ツール呼び出しなどのタスクに適しています。

モデル特徴

高効率推論
128Kの長いコンテキストをサポートし、単一のRTX GPUで実行可能
動的量子化技術
精度適応型量子化方法を採用し、1 - 2ビット量子化でも高い精度を維持
推論モード制御
システムプロンプトで詳細な推論プロセスを柔軟にオン/オフできる
ツール呼び出しサポート
組み込みのツール呼び出し解析器を備え、vLLMサーバーデプロイをサポート

モデル能力

テキスト生成
数学的推論
コード生成
多輪対話
ツール呼び出し
多言語サポート

使用事例

AIエージェントシステム
スマートチャットボット
推論能力を備えた対話システムを構築
自然で流れる多輪対話をサポート
開発ツール
コード支援
開発者がコードの補完とデバッグを行うのを支援
複数のプログラミング言語をサポート
教育
数学問題解決アシスタント
数学問題を解き、推論過程を表示
基礎モデルに比べて正解率が大幅に向上
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase