Q

Qwq 32B Gptqmodel 4bit Vortex V1

由ModelCloud開發
QwQ-32B是基於Qwen2架構的32B參數大語言模型,經過GPTQ方法4位整型量化處理,適用於高效文本生成任務。
下載量 1,620
發布時間 : 3/7/2025

模型概述

本模型是Qwen/QwQ-32B的4位整型GPTQ量化版本,專注於對話和指令跟隨任務,通過量化技術降低硬件需求同時保持較高性能。

模型特點

高效4位量化
採用GPTQ方法實現4位整型量化,顯著降低顯存佔用和計算資源需求
優化推理效率
啟用真序處理和對稱量化技術,提升推理速度
對話優化
經過指令微調,特別適合對話交互場景

模型能力

文本生成
對話交互
指令跟隨

使用案例

智能對話
問答系統
構建高效的知識問答機器人
在有限硬件資源下實現流暢對話體驗
內容生成
文本創作輔助
輔助用戶進行創意寫作或內容生成
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase