J

Josiefied Qwen3 8B Abliterated V1 GGUF

由Mungert開發
基於Qwen3-8B的量化版本,採用IQ-DynamicGate超低位量化技術,優化內存效率和推理速度
下載量 559
發布時間 : 5/14/2025

模型概述

該模型是Qwen3-8B的量化版本,特別針對低內存設備和邊緣計算優化,支持多種量化格式以適應不同硬件需求

模型特點

IQ-DynamicGate超低位量化
採用1-2比特量化技術,顯著減少內存佔用同時保持較高精度
分層量化策略
對不同層採用不同量化精度,關鍵組件保護確保模型性能
多格式支持
提供BF16、F16及多種量化格式,適應不同硬件需求

模型能力

文本生成
低內存推理
邊緣設備部署

使用案例

邊緣計算
低內存設備推理
在內存受限的設備上運行大型語言模型
減少內存佔用同時保持合理精度
研究
超低位量化研究
研究1-2比特量化對模型性能的影響
提供多種量化變體供研究比較
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase