N

Nvidia Llama 3.1 Nemotron 70B Instruct HF AWQ INT4

ibnzterrellによって開発
これはNVIDIAがMeta Llama-3.1-70B-Instructを基にカスタマイズしたLlama-3.1-Nemotron-70B-InstructモデルのAWQ 4ビット量子化バージョンで、生成応答の有用性向上に焦点を当てています。
ダウンロード数 206
リリース時間 : 10/24/2024

モデル概要

このモデルは大規模言語モデルで、高品質な回答を提供するために最適化されており、多言語をサポートし、テキスト生成タスクに適しています。

モデル特徴

高性能量子化
AutoAWQを使用してFP16からINT4へ量子化し、GEMMカーネル、ゼロポイント量子化、128のグループサイズを採用して推論効率を最適化しています。
多言語サポート
英語、ドイツ語、フランス語、スペイン語など多言語をサポートし、国際的なアプリケーションシナリオに適しています。
強化アライメントトレーニング
RLHFとHelpSteer2-Preferenceプロンプトを使用した強化学習アライメントトレーニングにより、生成応答の有用性を向上させています。

モデル能力

テキスト生成
多言語サポート
対話システム

使用事例

対話システム
インテリジェントカスタマーサポート
多言語インテリジェントカスタマーサポートシステムの構築に使用され、高品質な回答を提供します。
Arena Hardで85.0点、AlpacaEval 2 LCで57.6点を達成しました。
コンテンツ生成
多言語コンテンツ作成
ニュースやブログなどに適した高品質な多言語テキストコンテンツを生成します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase