L

Llama 3.1 Nemotron Nano 8B V1 GGUF

unslothによって開発
Llama-3.1-Nemotron-Nano-8B-v1はMeta Llama-3.1-8B-Instructをベースとした推論モデルで、推論能力、人間のチャット嗜好性、タスク実行能力を強化するための追加トレーニングが施されています。
ダウンロード数 22.18k
リリース時間 : 5/11/2025

モデル概要

これは大規模言語モデル(LLM)で、モデルの正確性と効率性の良いバランスを提供し、128Kのコンテキスト長をサポート、英語とプログラミング言語に適しています。

モデル特徴

強化された推論能力
教師あり微調整と強化学習を含む多段階の追加トレーニングプロセスにより、数学、コード、推論能力が大幅に向上
効率的な推論
単一のRTX GPUで動作可能で、ローカル展開に適し、計算効率とモデル精度のバランスが取れている
長文脈サポート
128Kトークンのコンテキスト長をサポートし、長文書や複雑なタスクの処理に適している
デュアルモード推論
'推論オン'と'推論オフ'の2つのモードをサポートし、様々なシナリオのニーズに対応

モデル能力

テキスト生成
数学的推論
コード生成
指示追従
チャット対話
ツール呼び出し
RAGシステムサポート

使用事例

AIエージェントシステム
インテリジェントチャットボット
複雑な指示を理解し自然な会話が可能なAIアシスタントを構築
MT-Benchで8.1点を獲得(推論オンモード)
教育
数学問題解答
複雑な数学問題を解決し段階的な説明を提供
MATH500で95.4% pass@1を達成(推論オンモード)
ソフトウェア開発
コード生成と支援
説明に基づいて機能コードを生成またはデバッグを支援
MBPP 0-shotテストで84.6% pass@1を達成
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase