L

Llama 3.2 3B Instruct Abliterated GGUF

由ZeroWw開發
一個經過優化的量化模型,輸出和嵌入張量使用f16格式,其餘張量使用q5_k或q6_k格式,體積更小且性能與純f16相當。
下載量 20
發布時間 : 10/8/2024

模型概述

該模型是一個量化版本,通過優化張量格式,減小模型體積的同時保持性能。適用於需要高效推理的場景。

模型特點

高效量化
輸出和嵌入張量使用f16格式,其餘張量使用q5_k或q6_k格式,顯著減小模型體積。
性能保留
量化後的模型性能與純f16格式相當,適合高效推理。

模型能力

文本生成

使用案例

高效推理
輕量級文本生成
適用於資源受限的設備上進行文本生成任務。
模型體積更小,性能與純f16相當。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase