N

Nemotron H 56B Base 8K

nvidiaによって開発
Nemotron-H-56B-Base-8KはNVIDIAが開発した大規模言語モデルで、混合Mamba-Transformerアーキテクチャを採用し、8Kのコンテキスト長と多言語テキスト生成をサポートします。
ダウンロード数 904
リリース時間 : 4/8/2025

モデル概要

このモデルはテキスト補完タスク向けに設計されており、英語、ドイツ語、スペイン語など複数言語をサポートし、研究開発シナリオに適しています。

モデル特徴

ハイブリッドアーキテクチャ
Mamba-2とMLP層を組み合わせ、わずか10のアテンション層で構成され、計算効率を最適化しています。
多言語サポート
中国語、英語、日本語など10言語のテキスト生成をサポートします。
長文コンテキスト処理
8Kのコンテキスト長をサポートし、長文タスクの処理に適しています。
効率的な推論
NVIDIA GPU向けに最適化され、高速なトレーニングと推論性能を提供します。

モデル能力

テキスト生成
多言語サポート
長文コンテキスト処理
コード生成
数学問題解答

使用事例

研究開発
言語モデル研究
大規模言語モデルの性能と改善方法を探求するために使用されます。
テキスト補完
一貫性のあるテキスト補完を生成し、執筆支援ツールに適しています。
教育
数学問題解答
小学校から上級数学問題まで解答し、多段階推論をサポートします。
GSM8K 8-shot CoT正解率93.71
プログラミング支援
コード生成
Pythonコードソリューションを生成し、プログラミングタスクに適しています。
MBPP(精製版)3-shot正解率77.82
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase