L

Llama 3 3 Nemotron Super 49B V1 GGUF

unslothによって開発
Llama-3.3-Nemotron-Super-49B-v1 は大規模言語モデルで、Meta Llama-3.3-70B-Instruct を改良し、推論能力、人間とのチャット適性、タスク実行能力を強化し、128Kトークンのコンテキスト長をサポートします。
ダウンロード数 814
リリース時間 : 5/22/2025

モデル概要

このモデルは推論とチャット用のモデルで、英語とプログラミング言語に適しており、複数の非英語言語をサポートします。多段階の追加トレーニングプロセスを経て、数学、コード、推論、ツール呼び出しの能力が強化されています。

モデル特徴

効率的な推論
神経アーキテクチャサーチ(NAS)による最適化で、精度と効率の優れたバランスを実現し、メモリ使用量を削減、単一GPUに適応。
多段階追加トレーニング
教師あり微調整と強化学習(RL)段階を経て、数学、コード、推論、指示追従能力を強化。
長文コンテキストサポート
128Kトークンのコンテキスト長をサポートし、複雑なタスクと大規模データ処理に適しています。

モデル能力

テキスト生成
数学的推論
コード生成
ツール呼び出し
多言語サポート
指示追従

使用事例

AIエージェントシステム
チャットボット
効率的なチャットボット構築に使用でき、多輪対話と複雑な指示をサポートします。
MT-Benchでスコア9.17を獲得。
RAGシステム
検索拡張生成(RAG)システム構築に使用し、大規模なコンテキスト情報を処理します。
128Kトークンのコンテキスト長をサポート。
数学とコード
数学問題解決
複雑な数学問題を解決し、段階的な推論と最終回答生成をサポートします。
MATH500でpass@1が96.6(推論有効)。
コード生成
Pythonなど複数のプログラミング言語をサポートする高品質なコードを生成します。
MBPP 0-shotでpass@1が91.3(推論有効)。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase