N

Nvidia Llama 3.1 Nemotron 70B Instruct HF AWQ INT4

由ibnzterrell開發
這是 NVIDIA 基於 Meta Llama-3.1-70B-Instruct 定製的 Llama-3.1-Nemotron-70B-Instruct 模型的 AWQ 4位量化版本,專注於提升生成響應的有用性。
下載量 206
發布時間 : 10/24/2024

模型概述

該模型是大型語言模型,經過優化以提供高質量的回答,支持多種語言,適用於文本生成任務。

模型特點

高性能量化
使用 AutoAWQ 從 FP16 量化至 INT4,採用 GEMM 內核、零點量化和 128 的分組大小,優化推理效率。
多語言支持
支持包括英語、德語、法語、西班牙語等在內的多種語言,適用於國際化應用場景。
強化對齊訓練
使用 RLHF 和 HelpSteer2-Preference prompts 進行強化學習對齊訓練,提升生成響應的有用性。

模型能力

文本生成
多語言支持
對話系統

使用案例

對話系統
智能客服
用於構建多語言智能客服系統,提供高質量的回答。
在 Arena Hard 上達到 85.0 分,AlpacaEval 2 LC 上達到 57.6 分。
內容生成
多語言內容創作
生成高質量的多語言文本內容,適用於新聞、博客等。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase