4bit量化

# 4bit量化

Diffucoder 7B Cpgrpo 4bit

DiffuCoder-7B-cpGRPO-4bit 是一个基于苹果 DiffuCoder-7B-cpGRPO 模型转换而来的 4 位量化版本，专为 MLX 框架优化。

大型语言模型其他

Hunyuan A13B Instruct 4bit

腾讯混元A13B大语言模型的4bit量化版本，适用于指令跟随任务

大型语言模型

Josiefied Qwen3 30B A3B Abliterated V2 4bit

这是一个基于Qwen3-30B模型转换而来的4位量化版本，适用于MLX框架的文本生成任务。

大型语言模型

Qwen3 235B A22B 4bit DWQ 053125

这是一个基于Qwen3-235B-A22B-8bit模型转换而来的4位量化版本，专为MLX框架优化，适用于文本生成任务。

大型语言模型

Deepseek R1 0528 Qwen3 8B 4bit

该模型是基于DeepSeek-R1-0528-Qwen3-8B转换的4位量化版本，专为MLX框架优化，适用于文本生成任务。

大型语言模型

Deepseek R1 0528 4bit

DeepSeek-R1-0528-4bit 是一个基于 DeepSeek-R1-0528 转换而来的 4 位量化模型，专为 MLX 框架优化。

大型语言模型

Llama 3.3 70B Instruct 4bit DWQ

基于Llama 3.3 70B指令微调模型的4位DWQ量化版本，适用于MLX框架的高效推理

大型语言模型支持多种语言

Devstral Small 2505 4bit DWQ

这是一个基于MLX格式的4位量化语言模型，适用于文本生成任务。

大型语言模型支持多种语言

Medgemma 27b Text It 4bit

MedGemma-27B-Text-IT-4bit是基于Google的MedGemma-27B-Text-IT模型转换而来的MLX格式模型，专为医疗和临床推理任务优化。

大型语言模型

Medgemma 4b It 4bit

MedGemma-4B-IT-4bit 是一个专为医学领域设计的视觉语言模型，支持图像和文本处理，适用于医学图像分析等任务。

图像生成文本

Gemma 3 27b It 4bit DWQ

这是一个基于Google Gemma 3 27B IT模型转换的4位量化版本，专为MLX框架优化。

大型语言模型

Qwen3 235B A22B 4bit DWQ

Qwen3-235B-A22B-4bit-DWQ是基于Qwen3-235B-A22B-8bit模型转换而来的4位量化版本，适用于文本生成任务。

大型语言模型

Qwen3 4B 4bit DWQ

该模型是Qwen3-4B的4位DWQ量化版本，转换为MLX格式，方便使用mlx库进行文本生成。

大型语言模型

Qwen3 30B A3B 4bit DWQ 05082025

这是一个基于Qwen/Qwen3-30B-A3B转换至MLX格式的4位量化模型，适用于文本生成任务。

大型语言模型

QWEN 3B INSTRUC Medical COT SFT 2kstep 4kcol

基于Qwen2.5架构的3B参数指令微调模型，使用Unsloth和Huggingface TRL库优化训练速度

大型语言模型

Transformers 英语

hailong18102002

Qwen3 30B A3B 4bit DWQ 0508

Qwen3-30B-A3B-4bit-DWQ-0508是基于Qwen/Qwen3-30B-A3B转换至MLX格式的4位量化模型，适用于文本生成任务。

大型语言模型

Qwen3 14B 4bit AWQ

Qwen3-14B-4bit-AWQ是基于Qwen/Qwen3-14B转换而来的MLX格式模型，使用AWQ量化技术将模型压缩至4bit，适用于MLX框架的高效推理。

大型语言模型

Qwen3 8B 4bit DWQ

Qwen3-8B-4bit-DWQ 是基于 Qwen/Qwen3-8B 转换至 MLX 格式的 4 位量化版本，适用于在 Apple 设备上高效运行。

大型语言模型

Phi 4 Mini Reasoning MLX 4bit

这是一个基于微软Phi-4-mini-reasoning模型转换的MLX格式4位量化版本，适用于文本生成任务。

大型语言模型

lmstudio-community

Josiefied Qwen3 1.7B Abliterated V1 4bit

基于Qwen3-1.7B的4位量化版本，适用于MLX框架的轻量级大语言模型

大型语言模型

Qwen3 8B 4bit AWQ

Qwen3-8B-4bit-AWQ 是基于 Qwen/Qwen3-8B 转换的 4bit AWQ 量化版本，适用于 MLX 框架的文本生成任务。

大型语言模型

Qwen3 235B A22B 4bit

该模型是基于Qwen/Qwen3-235B-A22B转换至MLX格式的4位量化版本，适用于文本生成任务。

大型语言模型

这是Qwen/Qwen3-8B模型的4位量化版本，已转换为MLX框架格式，适用于苹果芯片设备的高效推理。

大型语言模型

Qwen3 30B A3B 4bit

Qwen3-30B-A3B-4bit是基于Qwen/Qwen3-30B-A3B转换的4位量化版本，适用于在MLX框架下进行高效的文本生成任务。

大型语言模型

Qwen3-4B-4bit 是从 Qwen/Qwen3-4B 转换至 MLX 格式的 4 位量化版本，适用于在 Apple 芯片上高效运行。

大型语言模型

Qwen3 1.7B 4bit

Qwen3-1.7B-4bit是通义千问1.7B模型的4位量化版本，已转换为MLX框架格式，便于在Apple Silicon设备上高效运行。

大型语言模型

Qwen3 14B MLX 4bit

Qwen3-14B-4bit是基于Qwen/Qwen3-14B模型使用mlx-lm转换的4位量化版本，适用于文本生成任务。

大型语言模型

lmstudio-community

GLM Z1 32B 0414 4bit

该模型是基于THUDM/GLM-Z1-32B-0414转换的4位量化版本，适用于文本生成任务。

大型语言模型支持多种语言

Bge Multilingual Gemma2 GPTQ

这是BAAI/bge-multilingual-gemma2模型的4位GPTQ量化版本，支持多语言文本嵌入任务。

UI TARS 1.5 7B 4bit

UI-TARS-1.5-7B-4bit是一个多模态模型，专注于图像文本到文本的转换任务，支持英文语言。

图像生成文本

Transformers 支持多种语言

Dia-1.6B-4bit 是一个基于 MLX 格式的 4 位量化文本转语音模型，由 nari-labs/Dia-1.6B 转换而来。

语音合成英语

VL Rethinker 72B 4bit

VL-Rethinker-72B-4bit是一个基于Qwen2.5-VL-7B-Instruct的多模态模型，支持视觉问答任务，已转换为MLX格式以便在苹果设备上高效运行。

文本生成图像

Transformers 英语

3b De Ft Research Release 4bit

这是一个基于MLX格式转换的德语文本转语音模型，支持德语语言处理任务。

Transformers 德语

Space Voice Label Detect Beta

基于Qwen2.5-VL-3B模型的微调版本，使用Unsloth和Huggingface TRL库进行训练，推理速度提升2倍

文本生成图像

Transformers 英语

Olmo 2 0325 32B Instruct 4bit

这是一个基于allenai/OLMo-2-0325-32B-Instruct模型转换的4位量化版本，专为MLX框架优化，适用于文本生成任务。

大型语言模型

Transformers 英语

TraceBack 12b 是基于 Mistral-Nemo-Instruct 架构的 4bit 量化版本，专注于指令遵循和思维链推理任务。

大型语言模型

Janus Pro 1B 4bit

基于deepseek-ai/Janus-Pro-1B的4位量化版本，适用于Apple芯片的MLX框架

大型语言模型

Deepseek R1 Distill Qwen 32B 4bit

这是DeepSeek-R1-Distill-Qwen-32B模型的MLX 4-bit量化版本，适用于苹果芯片设备的高效推理

大型语言模型

Llama 3.2 11B Vision Radiology Mini

基于Unsloth优化的视觉指令微调模型，支持多模态任务处理

文本生成图像

Transformers 英语

Sales Conversations Unsloth Llama 3.1 8B Instruct

基于Meta-Llama-3.1-8B-Instruct的4位量化版本，使用Unsloth和TRL库进行高效训练

大型语言模型

Transformers 英语

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

English 简体中文繁體中文にほんご

© 2025AIbase