L

Llama 3.1 Nemotron 8B UltraLong 1M Instruct

由nvidia開發
專為處理超長文本序列(最高支持100萬、200萬和400萬標記)設計的大語言模型,在標準基準測試中保持卓越性能。
下載量 4,025
發布時間 : 3/4/2025

模型概述

基於Llama-3.1架構的超長上下文語言模型,通過高效持續預訓練與指令微調顯著提升長上下文理解與指令遵循能力。

模型特點

超長上下文支持
支持最高400萬標記的超長文本序列處理能力
高效訓練方案
結合高效持續預訓練與指令微調,顯著提升長上下文理解能力
性能保持
在擴展上下文窗口的同時不損失通用性能
多樣化評估
在長上下文任務和標準基準測試中均表現卓越

模型能力

超長文本序列處理
指令遵循
通用文本生成
數學推理
代碼生成

使用案例

長文檔處理
法律文檔分析
處理和分析超長法律合同和文檔
能夠準確理解和提取長文檔中的關鍵信息
科研論文摘要
對長篇科研論文進行總結和關鍵信息提取
保持對全文內容的連貫理解
對話系統
長對話記憶
支持超長對話歷史的記憶和上下文理解
在長對話中保持一致的響應
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase