L

Llama 3 3 Nemotron Super 49B V1

nvidiaによって開発
Llama-3.3-Nemotron-Super-49B-v1はMeta Llama-3.3-70B-Instructを基盤とした大規模言語モデルで、推論、対話選好、タスク実行に特化し、128Kトークンのコンテキスト長をサポートします。
ダウンロード数 150.65k
リリース時間 : 3/16/2025

モデル概要

このモデルはニューラルアーキテクチャサーチによりメモリ使用量を最適化し、単一GPUでの効率的な実行に適しており、AIエージェントシステム、チャットボット、RAGシステムなどのアプリケーションに適しています。

モデル特徴

効率的推論最適化
ニューラルアーキテクチャサーチによりメモリ使用量を削減し、スループットを向上、単一H100-80GB GPUでの実行に適しています。
長文コンテキストサポート
128Kトークンのコンテキスト長をサポートし、複雑なタスクや大規模ドキュメントの処理に適しています。
多段階トレーニング
教師あり微調整と強化学習(RLOO/RPO)を組み合わせ、数学、コード、推論、対話能力を最適化しました。

モデル能力

テキスト生成
数学的推論
コード生成
マルチターン対話
指示追従
ツール呼び出し

使用事例

企業AIアプリケーション
インテリジェントカスタマーサポート
高精度な対話システムを構築し、複雑なユーザークエリを処理します。
Arena-Hardベンチマークでスコア88.3(推論オフモード)。
ドキュメント分析
長文コンテキスト能力を活用して大規模な技術文書や法律文書を処理します。
教育
数学問題解決支援
数学問題を段階的に解答し、推論プロセスを提供します。
MATH500ベンチマークでpass@1が96.6(推論オンモード)。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase