Q

Qwen3 235B A22B GGUF

由ubergarm開發
Qwen3-235B-A22B 是一個2350億參數的大型語言模型,經過ik_llama.cpp分支的先進非線性量化處理,適用於高性能計算環境。
下載量 889
發布時間 : 4/30/2025

模型概述

該模型是一個混合量化的大型語言模型,專為高性能計算環境設計,支持對話式文本生成任務。

模型特點

先進非線性量化
使用ik_llama.cpp分支進行SotA級別的非線性量化,在給定內存佔用下提供最佳質量。
混合專家架構
採用混合專家模型(MoE)架構,包含94個重複層/塊,優化了計算資源分配。
高性能推理
設計用於在高端硬件配置下運行,支持GPU+CPU混合推理,實現高吞吐量。

模型能力

文本生成
對話式交互
長上下文處理(支持32k上下文)

使用案例

高性能計算
遊戲主機上的高質量LLM
在配備高端GPU和大量RAM的遊戲主機上運行高質量語言模型
在測試中獲得高達140 tok/sec的預填充速度和10 tok/sec的文本生成速度
研究開發
量化技術研究
用於研究先進的模型量化技術和方法
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase