L

Llama 3.1 Nemotron Nano 8B V1

nvidiaによって開発
Meta Llama-3.1-8B-Instructを基に最適化された推論と対話モデル、128Kのコンテキスト長をサポート、効率と性能のバランス
ダウンロード数 60.52k
リリース時間 : 3/16/2025

モデル概要

推論能力、人間の対話嗜好性、タスク実行(RAGやツール呼び出しなど)に特化した大規模言語モデル、単一GPU RTXでのローカルデプロイをサポート

モデル特徴

デュアルモード推論
推論ON/OFFモード切替をサポート、ONモードでは段階的思考プロセスを提供、OFFモードでは直接結果を出力
長文コンテキストサポート
最大128Kトークンのコンテキストウィンドウをサポート、複雑な文書や長い対話処理に適している
効率的なデプロイ
最適化によりRTXシリーズのコンシューマー向けGPUで単一カード動作可能、デプロイ障壁を低減
強化学習最適化
マルチラウンド強化学習(RLOO/RPO)により人間の嗜好性アライメントとタスク実行能力を最適化

モデル能力

数学的推論
コード生成
ツール呼び出し
マルチターン対話
多言語サポート
RAGシステム統合

使用事例

インテリジェントアシスタント
数学問題解決
複雑な数学方程式や証明問題を解決
MATH500テストセットで95.4%の精度を達成
プログラミング支援
Pythonコードの生成とデバッグ
MBPPゼロショットテストで84.6%の通過率
企業アプリケーション
ドキュメント分析
長文書や契約書テキストの分析処理
128Kコンテキスト長をサポート
ナレッジQAシステム
RAGベースの専門分野QAシステム構築
BFCL v2テストで63.9%スコア
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase