L

Llama 3.1 Nemotron 70B Instruct HF GGUF

由Mungert開發
基於Meta Llama-3.1-70B-Instruct微調的模型,採用NVIDIA HelpSteer2數據集優化,支持文本生成任務。
下載量 1,434
發布時間 : 4/6/2025

模型概述

這是一個70B參數的大語言模型,專為指令跟隨和文本生成任務優化,適用於多種自然語言處理場景。

模型特點

IQ-DynamicGate超低比特量化
採用1-2比特精度自適應量化技術,在保持內存效率的同時提升模型精度。
分層量化策略
對不同網絡層採用差異化量化方案,關鍵組件保護減少誤差傳播。
多格式支持
提供從BF16到極低比特IQ3_XS等多種量化格式,適應不同硬件需求。

模型能力

文本生成
指令跟隨
低資源推理

使用案例

資源受限環境
邊緣設備部署
在內存有限的邊緣設備上運行大語言模型
通過超低比特量化實現可接受的推理速度
研究領域
量化技術研究
研究超低比特量化對LLM性能的影響
提供多種量化方案對比數據
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase