# 4bit量化

Diffucoder 7B Cpgrpo 4bit
DiffuCoder-7B-cpGRPO-4bit 是一個基於蘋果 DiffuCoder-7B-cpGRPO 模型轉換而來的 4 位量化版本,專為 MLX 框架優化。
大型語言模型 其他
D
mlx-community
218
1
Hunyuan A13B Instruct 4bit
其他
騰訊混元A13B大語言模型的4bit量化版本,適用於指令跟隨任務
大型語言模型
H
mlx-community
201
4
Josiefied Qwen3 30B A3B Abliterated V2 4bit
這是一個基於Qwen3-30B模型轉換而來的4位量化版本,適用於MLX框架的文本生成任務。
大型語言模型
J
mlx-community
194
1
Qwen3 235B A22B 4bit DWQ 053125
Apache-2.0
這是一個基於Qwen3-235B-A22B-8bit模型轉換而來的4位量化版本,專為MLX框架優化,適用於文本生成任務。
大型語言模型
Q
mlx-community
200
1
Deepseek R1 0528 Qwen3 8B 4bit
MIT
該模型是基於DeepSeek-R1-0528-Qwen3-8B轉換的4位量化版本,專為MLX框架優化,適用於文本生成任務。
大型語言模型
D
mlx-community
924
1
Llama 3.3 70B Instruct 4bit DWQ
基於Llama 3.3 70B指令微調模型的4位DWQ量化版本,適用於MLX框架的高效推理
大型語言模型 支持多種語言
L
mlx-community
140
2
Medgemma 27b Text It 4bit
其他
MedGemma-27B-Text-IT-4bit是基於Google的MedGemma-27B-Text-IT模型轉換而來的MLX格式模型,專為醫療和臨床推理任務優化。
大型語言模型
M
mlx-community
193
3
Medgemma 4b It 4bit
其他
MedGemma-4B-IT-4bit 是一個專為醫學領域設計的視覺語言模型,支持圖像和文本處理,適用於醫學圖像分析等任務。
圖像生成文本 Transformers
M
mlx-community
196
1
Devstral Small 2505 4bit DWQ
Apache-2.0
這是一個基於MLX格式的4位量化語言模型,適用於文本生成任務。
大型語言模型 支持多種語言
D
mlx-community
238
3
Gemma 3 27b It 4bit DWQ
這是一個基於Google Gemma 3 27B IT模型轉換的4位量化版本,專為MLX框架優化。
大型語言模型
G
mlx-community
102
1
Qwen3 235B A22B 4bit DWQ
Apache-2.0
Qwen3-235B-A22B-4bit-DWQ是基於Qwen3-235B-A22B-8bit模型轉換而來的4位量化版本,適用於文本生成任務。
大型語言模型
Q
mlx-community
70
1
Qwen3 4B 4bit DWQ
Apache-2.0
該模型是Qwen3-4B的4位DWQ量化版本,轉換為MLX格式,方便使用mlx庫進行文本生成。
大型語言模型
Q
mlx-community
517
2
Qwen3 30B A3B 4bit DWQ 05082025
Apache-2.0
這是一個基於Qwen/Qwen3-30B-A3B轉換至MLX格式的4位量化模型,適用於文本生成任務。
大型語言模型
Q
mlx-community
240
5
QWEN 3B INSTRUC Medical COT SFT 2kstep 4kcol
Apache-2.0
基於Qwen2.5架構的3B參數指令微調模型,使用Unsloth和Huggingface TRL庫優化訓練速度
大型語言模型 Transformers 英語
Q
hailong18102002
30
1
Qwen3 30B A3B 4bit DWQ 0508
Apache-2.0
Qwen3-30B-A3B-4bit-DWQ-0508是基於Qwen/Qwen3-30B-A3B轉換至MLX格式的4位量化模型,適用於文本生成任務。
大型語言模型
Q
mlx-community
410
12
Qwen3 14B 4bit AWQ
Apache-2.0
Qwen3-14B-4bit-AWQ是基於Qwen/Qwen3-14B轉換而來的MLX格式模型,使用AWQ量化技術將模型壓縮至4bit,適用於MLX框架的高效推理。
大型語言模型
Q
mlx-community
252
2
Qwen3 8B 4bit DWQ
Apache-2.0
Qwen3-8B-4bit-DWQ 是基於 Qwen/Qwen3-8B 轉換至 MLX 格式的 4 位量化版本,適用於在 Apple 設備上高效運行。
大型語言模型
Q
mlx-community
306
1
Phi 4 Mini Reasoning MLX 4bit
MIT
這是一個基於微軟Phi-4-mini-reasoning模型轉換的MLX格式4位量化版本,適用於文本生成任務。
大型語言模型
P
lmstudio-community
72.19k
2
Josiefied Qwen3 1.7B Abliterated V1 4bit
基於Qwen3-1.7B的4位量化版本,適用於MLX框架的輕量級大語言模型
大型語言模型
J
mlx-community
135
2
Qwen3 8B 4bit AWQ
Apache-2.0
Qwen3-8B-4bit-AWQ 是基於 Qwen/Qwen3-8B 轉換的 4bit AWQ 量化版本,適用於 MLX 框架的文本生成任務。
大型語言模型
Q
mlx-community
1,682
1
Qwen3 235B A22B 4bit
Apache-2.0
該模型是基於Qwen/Qwen3-235B-A22B轉換至MLX格式的4位量化版本,適用於文本生成任務。
大型語言模型
Q
mlx-community
974
6
Qwen3 8B 4bit
Apache-2.0
這是Qwen/Qwen3-8B模型的4位量化版本,已轉換為MLX框架格式,適用於蘋果芯片設備的高效推理。
大型語言模型
Q
mlx-community
2,131
2
Qwen3 30B A3B 4bit
Apache-2.0
Qwen3-30B-A3B-4bit是基於Qwen/Qwen3-30B-A3B轉換的4位量化版本,適用於在MLX框架下進行高效的文本生成任務。
大型語言模型
Q
mlx-community
2,394
7
Qwen3 4B 4bit
Apache-2.0
Qwen3-4B-4bit 是從 Qwen/Qwen3-4B 轉換至 MLX 格式的 4 位量化版本,適用於在 Apple 芯片上高效運行。
大型語言模型
Q
mlx-community
7,400
6
Qwen3 1.7B 4bit
Apache-2.0
Qwen3-1.7B-4bit是通義千問1.7B模型的4位量化版本,已轉換為MLX框架格式,便於在Apple Silicon設備上高效運行。
大型語言模型
Q
mlx-community
11.85k
2
Qwen3 14B MLX 4bit
Apache-2.0
Qwen3-14B-4bit是基於Qwen/Qwen3-14B模型使用mlx-lm轉換的4位量化版本,適用於文本生成任務。
大型語言模型
Q
lmstudio-community
3,178
4
GLM Z1 32B 0414 4bit
MIT
該模型是基於THUDM/GLM-Z1-32B-0414轉換的4位量化版本,適用於文本生成任務。
大型語言模型 支持多種語言
G
mlx-community
225
2
Bge Multilingual Gemma2 GPTQ
Apache-2.0
這是BAAI/bge-multilingual-gemma2模型的4位GPTQ量化版本,支持多語言文本嵌入任務。
文本嵌入 Transformers
B
shuyuej
34
5
UI TARS 1.5 7B 4bit
Apache-2.0
UI-TARS-1.5-7B-4bit是一個多模態模型,專注於圖像文本到文本的轉換任務,支持英文語言。
圖像生成文本 Transformers 支持多種語言
U
mlx-community
184
1
Dia 1.6B 4bit
Apache-2.0
Dia-1.6B-4bit 是一個基於 MLX 格式的 4 位量化文本轉語音模型,由 nari-labs/Dia-1.6B 轉換而來。
語音合成 英語
D
mlx-community
168
4
VL Rethinker 72B 4bit
Apache-2.0
VL-Rethinker-72B-4bit是一個基於Qwen2.5-VL-7B-Instruct的多模態模型,支持視覺問答任務,已轉換為MLX格式以便在蘋果設備上高效運行。
文本生成圖像 Transformers 英語
V
mlx-community
26
0
3b De Ft Research Release 4bit
Apache-2.0
這是一個基於MLX格式轉換的德語文本轉語音模型,支持德語語言處理任務。
語音合成 Transformers 德語
3
mlx-community
19
0
Space Voice Label Detect Beta
Apache-2.0
基於Qwen2.5-VL-3B模型的微調版本,使用Unsloth和Huggingface TRL庫進行訓練,推理速度提升2倍
文本生成圖像 Transformers 英語
S
devJy
38
1
Olmo 2 0325 32B Instruct 4bit
Apache-2.0
這是一個基於allenai/OLMo-2-0325-32B-Instruct模型轉換的4位量化版本,專為MLX框架優化,適用於文本生成任務。
大型語言模型 Transformers 英語
O
mlx-community
270
10
Traceback 12b
Apache-2.0
TraceBack 12b 是基於 Mistral-Nemo-Instruct 架構的 4bit 量化版本,專注於指令遵循和思維鏈推理任務。
大型語言模型 Transformers
T
secemp9
1,470
29
Janus Pro 1B 4bit
MIT
基於deepseek-ai/Janus-Pro-1B的4位量化版本,適用於Apple芯片的MLX框架
大型語言模型
J
wnma3mz
40
3
Deepseek R1 Distill Qwen 32B 4bit
這是DeepSeek-R1-Distill-Qwen-32B模型的MLX 4-bit量化版本,適用於蘋果芯片設備的高效推理
大型語言模型 Transformers
D
mlx-community
130.79k
40
Llama 3.2 11B Vision Radiology Mini
Apache-2.0
基於Unsloth優化的視覺指令微調模型,支持多模態任務處理
文本生成圖像 Transformers 英語
L
mervinpraison
39
2
Sales Conversations Unsloth Llama 3.1 8B Instruct
Apache-2.0
基於Meta-Llama-3.1-8B-Instruct的4位量化版本,使用Unsloth和TRL庫進行高效訓練
大型語言模型 Transformers 英語
S
vakodiya
22
1
Llama3.1 8b Instruct Summarize Q4 K M
Apache-2.0
基於Meta-Llama-3.1-8B-Instruct的4位量化版本,使用Unsloth和Huggingface TRL庫進行訓練,速度提升2倍。
大型語言模型 英語
L
raaec
107
0
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase