Llama-3.1-8B-UltraLong-1M-Instructオープンソース言語モデル - 無料で超長テキストを処理可能、400万トークンのコンテキスト

ホーム

Llama 3.1 8B UltraLong 1M Instruct

nvidiaによって開発

Nemotron-UltraLong-8Bシリーズは、超長文テキストシーケンスの処理に特化した言語モデルで、最大400万トークンのコンテキストウィンドウをサポートし、卓越した性能を維持します。

大規模言語モデル

Transformers

英語#超長文脈理解 #百万トークン処理 #命令微調整最適化

ダウンロード数 1,387

リリース時間 : 3/4/2025

モデル概要

Llama-3.1アーキテクチャに基づく超長文脈言語モデルで、効率的な継続事前学習と命令微調整により、長文脈理解と命令追従能力を向上させています。

モデル特徴

超長文脈サポート

最大400万トークンのコンテキストウィンドウをサポートし、超長文テキストシーケンスの処理に特化しています。

効率的なトレーニング手法

継続事前学習と命令微調整を組み合わせることで、長文脈理解と命令追従能力を大幅に向上させます。

性能バランス

コンテキストウィンドウを拡張しながら、標準ベンチマークテストでの卓越した性能を維持します。

モデル能力

超長文テキストシーケンス処理

命令追従

汎用テキスト生成

数学的推論

コード生成

使用事例

長文書処理

法律文書分析

超長文の法律文書を処理・分析し、キー情報を抽出します。

長文書の内容を効率的に理解し、情報を正確に抽出します。

学術論文要約

長編学術論文の要約とキーポイント抽出を行います。

正確かつ包括的な要約を生成します。

対話システム

長文脈チャットボット

長い対話履歴を記憶・参照できるチャットボットを構築します。

一貫性があり文脈に関連した返答を提供します。

🚀 Nemotron-UltraLong-8B

Nemotron-UltraLong-8Bは、長文のテキストシーケンス（最大1M、2M、および4Mトークン）を処理することができ、標準的なベンチマークでも高い性能を維持する超長文対応の言語モデルシリーズです。Llama-3.1をベースに構築され、効率的な継続事前学習と命令微調整を組み合わせたトレーニング方法を用いることで、長文理解と命令追従能力を向上させています。

🚀 クイックスタート

transformers >= 4.43.0以降では、Transformersのpipeline抽象化を使用するか、generate()関数を持つAutoクラスを利用して会話推論を実行できます。

pip install --upgrade transformersを実行して、Transformersのインストールを更新してください。

💻 使用例

基本的な使用法

import transformers
import torch

model_id = "nvidia/Llama-3.1-Nemotron-8B-UltraLong-1M-Instruct"

pipeline = transformers.pipeline(
    "text-generation",
    model=model_id,
    model_kwargs={"torch_dtype": torch.bfloat16},
    device_map="auto",
)

messages = [
    {"role": "system", "content": "You are a pirate chatbot who always responds in pirate speak!"},
    {"role": "user", "content": "Who are you?"},
]

outputs = pipeline(
    messages,
    max_new_tokens=256,
)
print(outputs[0]["generated_text"][-1])

✨ 主な機能

超長文のテキストシーケンス（最大1M、2M、および4Mトークン）を処理可能
標準的なベンチマークでも高い性能を維持
Llama-3.1をベースに、効率的な継続事前学習と命令微調整により、長文理解と命令追従能力を向上

📦 UltraLongモデル

📚 ドキュメント

モデルカード

属性	详情
ベースモデル	meta-llama/Llama-3.1-8B-Instruct
継続事前学習	トレーニングデータは、サンプル長に基づくドメインごとのアップサンプリングを使用して事前学習コーパスから取得した10億トークンで構成されています。モデルは、シーケンス長1M、グローバルバッチサイズ8で125イテレーションのトレーニングを行いました。
教師付き微調整（SFT）	一般、数学、コードのドメインにまたがるオープンソースの命令データセット上の10億トークン。AceMath-Instructの「general_sft_stage2」からデータをサブサンプリングしました。
最大コンテキストウィンドウ	100万トークン

評価結果

Nemotron-UltraLong-8Bを、長文タスク（例：RULER、LV-Eval、InfiniteBench）や標準タスク（例：MMLU、MATH、GSM-8K、HumanEval）などの様々なベンチマークで評価しました。UltraLong-8Bは、超長文タスクで卓越した性能を発揮し、標準的なベンチマークでも高い結果を維持しています。

大海原の針（Needle in a Haystack）

長文評価

標準能力評価

🔧 対応者

Chejian Xu (chejian2@illinois.edu)、Wei Ping (wping@nvidia.com)

📄 ライセンス

このモデルは、CC BY-NC 4.0ライセンスの下で提供されています。

📖 引用

@article{ulralong2025,
  title={From 128K to 4M: Efficient Training of Ultra-Long Context Large Language Models},
  author={Xu, Chejian and Ping, Wei and Xu, Peng and Liu, Zihan and Wang, Boxin and Shoeybi, Mohammad and Catanzaro, Bryan},
  journal={arXiv preprint},
  year={2025}
 }