N

Nemotron H 47B Base 8K

由nvidia開發
NVIDIA Nemotron-H-47B-Base-8K 是由 NVIDIA 開發的大型語言模型(LLM),設計用於對給定文本進行補全。該模型採用混合架構,主要由 Mamba-2 和 MLP 層組成,並僅包含五個注意力層。
下載量 1,242
發布時間 : 4/8/2025

模型概述

Nemotron-H-47B-Base-8K 是一個大型語言模型,支持 8K 上下文長度,適用於文本生成任務。支持多種語言,包括英語、德語、西班牙語、法語、意大利語、韓語、葡萄牙語、俄語、日語和中文。

模型特點

混合架構
採用 Mamba-2 和 MLP 層的混合架構,僅包含五個注意力層,提高了模型的效率和性能。
多語言支持
支持 10 種語言,包括英語、德語、西班牙語、法語、意大利語、韓語、葡萄牙語、俄語、日語和中文。
8K 上下文長度
支持長達 8K 的上下文長度,適用於處理長文本任務。
高效訓練
通過 630 億 token 從 Nemotron-H-56B-Base-8K 剪枝和蒸餾而來,優化了訓練效率。

模型能力

文本生成
多語言文本補全
長文本處理

使用案例

研究與開發
大型語言模型研究
用於構建和優化大型語言模型的研究項目。
支持多種語言和長上下文處理。
文本生成任務
用於生成和補全文本內容,如文章、對話等。
生成高質量的多語言文本。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase