Llama-3.1-Nemotron-8B-UltraLong-4M-Instructオープンソース言語モデル - 超長テキスト処理と卓越したパフォーマンスを兼ね備える

Home

Llama 3.1 Nemotron 8B UltraLong 4M Instruct

Developed by nvidia

Nemotron-UltraLong-8Bは超長文テキストシーケンス処理に特化した言語モデルで、最大400万トークンのコンテキストウィンドウをサポートし、標準ベンチマークテストでも卓越した性能を維持します。

大規模言語モデル

Transformers

English#超長文脈理解 #400万トークン対応 #多分野インストラクションチューニング

Downloads 4,363

Release Time : 3/4/2025

Model Overview

Llama-3.1アーキテクチャを基にしたUltraLong-8Bは、効率的な継続事前学習とインストラクションチューニングを組み合わせた体系的トレーニングスキームを採用し、長文理解とインストラクション追従能力を大幅に向上させています。

Model Features

超長文脈サポート

最大400万トークンのコンテキストウィンドウをサポートし、超長文テキストシーケンスを処理可能。

効率的なトレーニングスキーム

体系的トレーニングスキームを採用し、継続事前学習とインストラクションチューニングを組み合わせることで、長文理解能力を向上。

卓越した性能

長文脈タスクと標準ベンチマークテストの両方で卓越したパフォーマンスを発揮。

Model Capabilities

超長文理解

インストラクション追従

テキスト生成

数学的推論

コード生成

Use Cases

長文処理

長文要約

超長文ドキュメントの要約生成。

長文質問応答

超長文テキストでの質問応答タスク。

汎用タスク

数学的推論

数学問題の解決。

コード生成

コードスニペットの生成。

🚀 Nemotron-UltraLong-8B

Nemotron-UltraLong-8Bは、標準的なベンチマークで競争力のあるパフォーマンスを維持しながら、大量のテキストシーケンス（最大100万、200万、400万トークン）を処理するように設計された超長文脈言語モデルのシリーズです。Llama-3.1をベースに構築され、効率的な継続事前学習と命令微調整を組み合わせたシステマティックな学習方法を活用して、長文脈理解と命令追従能力を強化しています。このアプローチにより、モデルは一般的なパフォーマンスを犠牲にすることなく、文脈ウィンドウを効率的に拡張することができます。

🚀 クイックスタート

transformers >= 4.43.0以降では、Transformersのpipeline抽象化を使用するか、generate()関数を持つAutoクラスを利用することで、会話推論を実行できます。

pip install --upgrade transformersを実行して、transformersのインストールを更新してください。

✨ 主な機能

超長文脈のテキストを処理できる（最大100万、200万、400万トークン）
標準的なベンチマークでも競争力のあるパフォーマンスを維持
Llama-3.1をベースに、長文脈理解と命令追従能力を強化
文脈ウィンドウを効率的に拡張できる

📦 インストール

pip install --upgrade transformers

💻 使用例

基本的な使用法

import transformers
import torch

model_id = "nvidia/Llama-3.1-Nemotron-8B-UltraLong-4M-Instruct"

pipeline = transformers.pipeline(
    "text-generation",
    model=model_id,
    model_kwargs={"torch_dtype": torch.bfloat16},
    device_map="auto",
)

messages = [
    {"role": "system", "content": "You are a pirate chatbot who always responds in pirate speak!"},
    {"role": "user", "content": "Who are you?"},
]

outputs = pipeline(
    messages,
    max_new_tokens=256,
)
print(outputs[0]["generated_text"][-1])

📚 ドキュメント

モデル情報

属性	详情
モデルタイプ	Nemotron-UltraLong-8Bは、超長文脈言語モデルのシリーズです。
ベースモデル	meta-llama/Llama-3.1-8B-Instruct
継続事前学習	学習データは、サンプル長に基づくドメインごとのアップサンプリングを使用して事前学習コーパスから取得した10億トークンで構成されています。モデルは、シーケンス長400万、グローバルバッチサイズ2で150回の反復学習を行いました。
教師付き微調整 (SFT)	一般、数学、コードのドメインにまたがるオープンソースの命令データセット上で10億トークンを使用しました。 AceMath-Instruct の 'general_sft_stage2' からデータをサブサンプリングしました。
最大文脈ウィンドウ	400万トークン

評価結果

Nemotron-UltraLong-8Bを、長文脈タスク（例：RULER、LV-Eval、InfiniteBench）や標準タスク（例：MMLU、MATH、GSM-8K、HumanEval）などの多様なベンチマークで評価しています。UltraLong-8Bは、超長文脈タスクで優れたパフォーマンスを達成し、標準的なベンチマークでも競争力のある結果を維持しています。

ニードルインハウス

長文脈評価

標準能力評価

対応者

Chejian Xu (chejian2@illinois.edu), Wei Ping (wping@nvidia.com)

引用

@article{ulralong2025,
  title={From 128K to 4M: Efficient Training of Ultra-Long Context Large Language Models},
  author={Xu, Chejian and Ping, Wei and Xu, Peng and Liu, Zihan and Wang, Boxin and Shoeybi, Mohammad and Catanzaro, Bryan},
  journal={arXiv preprint},
  year={2025}
 }