# 4bit量化推理

GLM 4 32B 0414 4bit DWQ
MIT
這是THUDM/GLM-4-32B-0414模型的MLX格式版本,經過4位DWQ量化處理,適用於蘋果芯片設備的高效推理。
大型語言模型 支持多種語言
G
mlx-community
156
4
Gemma 3 12b It 4bit DWQ
Gemma 3 12B模型的4位量化版本,適用於MLX框架,支持高效文本生成任務。
大型語言模型
G
mlx-community
554
2
SWE Agent LM 32B 4bit
Apache-2.0
這是一個基於SWE-bench/SWE-agent-LM-32B模型轉換而來的4位量化版本,專為軟件工程任務優化的語言模型。
大型語言模型 Transformers 英語
S
mlx-community
31
1
Josiefied Qwen3 4B Abliterated V1 4bit
這是一個基於Qwen3-4B模型轉換到MLX格式的4位量化版本,適用於文本生成任務。
大型語言模型
J
mlx-community
175
1
Qwen3 0.6B 4bit
Apache-2.0
這是一個基於Qwen/Qwen3-0.6B模型轉換的4位量化版本,適用於MLX框架的高效推理。
大型語言模型
Q
mlx-community
6,015
5
GLM 4 32B 0414 4bit
MIT
GLM-4-32B-0414-4bit 是基於 THUDM/GLM-4-32B-0414 轉換而來的 MLX 格式模型,支持中英文文本生成任務。
大型語言模型 支持多種語言
G
mlx-community
361
3
Philosophy Model
Apache-2.0
這是一個使用Unsloth和Huggingface TRL庫優化的Mistral-7B指令微調模型,訓練速度提升2倍
大型語言模型 Transformers 英語
P
raak-16
54
2
Gemma 3 4b It Qat 4bit
其他
Gemma 3 4B IT QAT 4bit 是一個經過量化感知訓練(QAT)的4位量化大語言模型,基於Gemma 3架構,專為MLX框架優化。
圖像生成文本 Transformers 其他
G
mlx-community
607
1
Deepseek R1 Chinese Law
Apache-2.0
基於Unsloth和Huggingface TRL庫訓練的Llama模型,推理速度提升2倍
大型語言模型 Transformers 英語
D
corn6
74
2
Llama 3.2 Vision Instruct Bpmncoder
Apache-2.0
基於Unsloth優化的Llama 3.2 11B視覺指令微調模型,採用4位量化技術,訓練速度提升2倍
文本生成圖像 Transformers 英語
L
utkarshkingh
40
1
Qwen2 Vl Instuct Bpmncoder
Apache-2.0
基於Qwen2-VL-7B模型的4位量化版本,使用Unsloth和Huggingface TRL庫進行訓練,推理速度提升2倍
文本生成圖像 Transformers 英語
Q
utkarshkingh
18
1
Nano R1 Model
Apache-2.0
基於Unsloth和Huggingface TRL庫優化的Qwen2模型,推理速度提升2倍
大型語言模型 Transformers 英語
N
Mansi-30
25
2
Llama 3.2 11B Vision Invoices Mini
Apache-2.0
基於unsloth/llama-3.2-11b-vision-instruct-unsloth-bnb-4bit微調的多模態大語言模型,支持視覺指令理解任務,使用Unsloth優化訓練速度提升2倍。
文本生成圖像 Transformers 英語
L
atulSethi
46
1
Qwen 2 VL 7B OCR
Apache-2.0
基於Qwen2-VL-7B模型的微調版本,使用Unsloth和Huggingface的TRL庫進行訓練,速度提升2倍。
文本生成圖像 Transformers 英語
Q
Swapnik
103
1
Llama Bodo Translation Model
Apache-2.0
基於Meta-Llama-3.1-8B的4位量化版本微調的博多語-英語雙向翻譯模型,使用Unsloth優化訓練速度
大型語言模型 Transformers 支持多種語言
L
Luson045
27
1
Qvikhr 2.5 1.5B Instruct SMPO MLX 4bit
Apache-2.0
這是一個基於QVikhr-2.5-1.5B-Instruct-SMPO模型的4位量化版本,專為MLX框架優化,支持俄語和英語的指令理解與生成任務。
大型語言模型 Transformers 支持多種語言
Q
Vikhrmodels
249
2
Mlx Stable Diffusion 3.5 Large 4bit Quantized
其他
這是基於Stable Diffusion 3.5 Large模型在DiffusionKit MLX框架上量化的版本,適用於圖像生成任務。
文本生成圖像 英語
M
argmaxinc
2,101
4
Awportrait FL NF4
其他
AWPortrait-FL的BNB-NF4量化版本,基於FLUX.1-dev開發的文本到圖像生成模型
圖像生成 英語
A
skunkworx
34
1
Text2cypher Gemma 2 9b It Finetuned 2024v1
Apache-2.0
該模型是基於google/gemma-2-9b-it微調的Text2Cypher模型,能夠將自然語言問題轉換為Neo4j圖數據庫的Cypher查詢語句。
知識圖譜 英語
T
neo4j
2,093
22
Midnight Miqu 70B V1.5 4bit
Midnight-Miqu-70B-v1.5 是一個70B參數規模的大語言模型,支持文本生成等任務。
大型語言模型 Transformers
M
cecibas
361.62k
3
Google Gemma 2b AWQ 4bit Smashed
基於google/gemma-2b模型通過AWQ技術壓縮的4位量化版本,旨在提升推理效率並降低資源消耗。
大型語言模型 Transformers
G
PrunaAI
33
1
C4ai Command R V01 4bit
該模型是從 CohereForAI/c4ai-command-r-v01 轉換為 MLX 格式的 4bit 量化版本,支持多語言對話和工具使用。
大型語言模型 Transformers 支持多種語言
C
mlx-community
381
23
Gpt4 X Alpaca 13b Native 4bit 128g
基於GPT4和Alpaca指令微調的13B參數語言模型,支持4bit量化推理
大型語言模型 Transformers
G
anon8231489123
344
736
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase