L

Llama 3.1 Nemotron 70B Instruct HF

nvidiaによって開発
NVIDIAがカスタマイズした大規模言語モデルで、大規模言語モデルがユーザーのクエリに対して生成する返答の有用性を向上させることを目的としています。
ダウンロード数 29.98k
リリース時間 : 10/12/2024

モデル概要

Llama-3.1-70B-Instructをベースにした強化学習による微調整モデルで、命令追従能力と返答の有用性の向上に焦点を当てています。

モデル特徴

強化学習による微調整
REINFORCEアルゴリズムとHelpSteer2-Preferenceデータセットを使用した強化学習による微調整
高性能ベンチマーク
Arena Hard、AlpacaEval 2 LC、MT Benchなどのベンチマークで優れた性能を発揮
複雑な命令理解
多段階の推論を必要とする複雑な質問を理解し、正しく回答することが可能

モデル能力

テキスト生成
命令追従
複雑な推論
マルチターン対話

使用事例

インテリジェントアシスタント
質問応答システム
多段階の推論を必要とする複雑な問題を含む、ユーザーの様々な質問に回答
Arena Hardテストで85.0点を獲得
コンテンツ生成
詳細なコンテンツ作成
詳細で一貫性のある長文コンテンツを生成
平均返答長は2199.8文字
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase