Qwen3-235B-A22B-exl2開源模型 - 多精度量化高效完成文本生成任務

首頁

Qwen3 235B A22B Exl2

由MikeRoz開發

Qwen3-235B-A22B的Exllamav2量化版本，提供多種量化精度選擇，適用於高效文本生成任務。

大型語言模型開源協議:Apache-2.0 #大語言模型量化 #ExLlamaV2優化 #多精度可選

下載量 53

發布時間 : 5/2/2025

模型概述

基於Qwen3-235B-A22B大語言模型的Exllamav2量化版本，支持不同比特寬度的量化配置，適用於需要高效推理的文本生成場景。

模型特點

多精度量化支持

提供2.25bpw、3.00bpw和4.00bpw三種量化精度選擇，滿足不同場景下的精度和效率需求

高效推理

通過Exllamav2量化技術實現更高效的大模型推理

前沿技術支持

使用Exllamav2開發分支的最新量化技術（commit 68976a0）

模型能力

文本生成

大語言模型推理

使用案例

文本生成

內容創作

用於自動生成文章、故事等內容

對話系統

構建智能對話助手

屬性	詳情
庫名稱	exllamav2
模型類型	對Qwen/Qwen3 - 235B - A22B進行Exllamav2量化後的模型
基礎模型	Qwen/Qwen3 - 235B - A22B
基礎模型關係	量化版本
標籤	exl2
任務類型	文本生成
許可證	Apache 2.0

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

智啟未來，您的人工智能解決方案智庫

Qwen3 235B A22B Exl2

模型概述

模型特點

模型能力

使用案例

🚀 Exllamav2量化模型

🚀 快速開始

不同量化版本及大小

📄 許可證

📦 模型信息