L

Llama 3.1 Nemotron Nano 4B V1.1 GGUF

lmstudio-communityによって開発
NVIDIAがリリースした40億パラメータ規模の大規模言語モデルで、128kトークンのコンテキスト長をサポートし、推論、対話、RAGなどのタスクに最適化されています
ダウンロード数 588
リリース時間 : 5/20/2025

モデル概要

Llama 3.1 8Bモデルを基に、プルーニングと蒸留技術を用いて作成された軽量モデルで、人間の対話嗜好や検索拡張生成(RAG)、ツール呼び出しなどの能力を最適化しています

モデル特徴

超長文脈サポート
128kトークンのコンテキストウィンドウをサポートし、長文書や複雑な対話シナリオの処理に適しています
軽量化設計
8Bモデルからプルーニングと蒸留技術で圧縮され、性能を維持しながら計算リソース要件を低減しています
対話最適化
人間の対話嗜好に特化して最適化されており、より自然なインタラクション応答を生成します

モデル能力

テキスト生成
対話システム
検索拡張生成(RAG)
ツール呼び出し

使用事例

インテリジェントアシスタント
カスタマーサービス対話システム
オンラインカスタマーサービスアシスタントとしてユーザー問い合わせを処理
複雑な問題を理解し、業務シナリオに適した返答を生成できます
知識処理
長文書分析
技術文書、法律文書などの長文テキスト資料を処理
128kコンテキストウィンドウを活用して長期記憶と一貫した理解を維持します
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase