L

Llama 3.1 Nemotron Nano 4B V1.1 GGUF

Developed by Mungert
Llama-3.1-Nemotron-Nano-4B-v1.1は、Llama 3.1をベースに最適化された大規模言語モデルで、精度と効率のバランスが良好で、AIエージェントやチャットボットなどの様々なシーンに適しています。
Downloads 2,177
Release Time : 5/21/2025

Model Overview

このモデルはNVIDIAが開発した4Bパラメータの大規模言語モデルで、128Kのコンテキスト長をサポートし、推論、チャット、RAG、ツール呼び出しなどのタスクに適しています。

Model Features

高効率推論
128Kの長いコンテキストをサポートし、単一のRTX GPUで実行可能
動的量子化技術
精度適応型量子化方法を採用し、1 - 2ビット量子化でも高い精度を維持
推論モード制御
システムプロンプトで詳細な推論プロセスを柔軟にオン/オフできる
ツール呼び出しサポート
組み込みのツール呼び出し解析器を備え、vLLMサーバーデプロイをサポート

Model Capabilities

テキスト生成
数学的推論
コード生成
多輪対話
ツール呼び出し
多言語サポート

Use Cases

AIエージェントシステム
スマートチャットボット
推論能力を備えた対話システムを構築
自然で流れる多輪対話をサポート
開発ツール
コード支援
開発者がコードの補完とデバッグを行うのを支援
複数のプログラミング言語をサポート
教育
数学問題解決アシスタント
数学問題を解き、推論過程を表示
基礎モデルに比べて正解率が大幅に向上
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase