L

Llama 3.1 Nemotron 8B UltraLong 1M Instruct

Developed by nvidia
專為處理超長文本序列(最高支持100萬、200萬和400萬標記)設計的大語言模型,在標準基準測試中保持卓越性能。
Downloads 4,025
Release Time : 3/4/2025

Model Overview

基於Llama-3.1架構的超長上下文語言模型,通過高效持續預訓練與指令微調顯著提升長上下文理解與指令遵循能力。

Model Features

超長上下文支持
支持最高400萬標記的超長文本序列處理能力
高效訓練方案
結合高效持續預訓練與指令微調,顯著提升長上下文理解能力
性能保持
在擴展上下文窗口的同時不損失通用性能
多樣化評估
在長上下文任務和標準基準測試中均表現卓越

Model Capabilities

超長文本序列處理
指令遵循
通用文本生成
數學推理
代碼生成

Use Cases

長文檔處理
法律文檔分析
處理和分析超長法律合同和文檔
能夠準確理解和提取長文檔中的關鍵信息
科研論文摘要
對長篇科研論文進行總結和關鍵信息提取
保持對全文內容的連貫理解
對話系統
長對話記憶
支持超長對話歷史的記憶和上下文理解
在長對話中保持一致的響應
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase