L

Llama 3 1 Nemotron Ultra 253B V1

nvidiaによって開発
Meta Llama-3.1-405B-Instructをベースとした大規模言語モデルで、ニューラルアーキテクチャサーチ技術により最適化され、128Kトークンの文脈長をサポートし、推論、対話、命令追従タスクに適しています。
ダウンロード数 21.78k
リリース時間 : 4/7/2025

モデル概要

Llama-3.1-Nemotron-Ultra-253B-v1はNVIDIAが開発した大規模言語モデルで、効率的な推論と複雑なタスクのために設計されており、多言語と長文脈処理をサポートします。

モデル特徴

効率的な推論最適化
ニューラルアーキテクチャサーチ(NAS)技術によりモデル構造を最適化し、メモリ使用量を大幅に削減し、推論効率を向上させます。
長文脈サポート
最大131,072トークンの文脈処理能力をサポートし、複雑なタスクの処理に適しています。
多段階トレーニング
教師あり微調整と強化学習の多段階トレーニングを経て、数学、プログラミング、推論、対話能力を最適化しました。
推論モード制御
システムプロンプトによる詳細推論モードのオン/オフをサポートし、さまざまなアプリケーションシナリオのニーズに対応します。

モデル能力

テキスト生成
数学的推論
プログラミング支援
多言語処理
命令追従
ツール呼び出し
RAGシステムサポート

使用事例

AIエージェントシステム
チャットボット
高性能な対話システムを構築し、複雑なインタラクションとマルチターン対話をサポートします。
対話タスクで優れたパフォーマンスを発揮
RAGシステム
検索ベースの生成タスクをサポートし、長文書と複雑なクエリを処理します。
128Kトークンの文脈をサポート
専門分野アプリケーション
医学質問応答
専門的な医学質問に回答し、診断支援をサポートします。
GPQAテスト通過率76.01%
数学コンテスト
複雑な数学問題を解決し、段階的な推論をサポートします。
AIME25テスト通過率72.50%
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase