N

Nvidia Llama 3.1 Nemotron Nano 4B V1.1 GGUF

由bartowski開發
基於NVIDIA Llama-3.1-Nemotron-Nano-4B-v1.1模型的量化版本,使用llama.cpp工具進行多種量化處理,適合在資源受限的環境中運行。
下載量 2,553
發布時間 : 5/20/2025

模型概述

這是一個4B參數規模的大語言模型,經過多種量化處理以減小模型體積,同時保持較高的推理質量。支持英語文本生成任務。

模型特點

多種量化選項
提供從BF16到Q2_K等多種量化版本,滿足不同硬件和性能需求
嵌入/輸出權重優化
部分量化版本(Q3_K_XL、Q4_K_L等)的嵌入和輸出權重使用Q8_0量化,提高質量
ARM/AVX優化
支持在線重打包功能,優化在ARM和AVX硬件上的運行性能
廣泛兼容性
可在LM Studio、llama.cpp及任何基於llama.cpp的項目中運行

模型能力

英語文本生成
對話系統
內容創作

使用案例

對話系統
智能助手
構建英語對話型智能助手
能夠理解並生成自然的英語對話
內容創作
文本生成
生成各種類型的英語文本內容
可生成連貫、有邏輯的英語文章
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase