Model Selection

MLX优化

# MLX优化

Kimi Dev 72B 8bit

Kimi-Dev-72B-8bit 是基于 moonshotai/Kimi-Dev-72B 转换的 8 位量化版本，适用于 MLX 框架的文本生成模型。

大型语言模型 Other

Kimi Dev 72B 4bit DWQ

Kimi-Dev-72B-4bit-DWQ 是一个基于 moonshotai/Kimi-Dev-72B 转换而来的 4 位量化大语言模型，适用于 MLX 框架。

大型语言模型 Other

Devstral Small 2507 4bit DWQ

这是一个基于MLX格式的4位量化语言模型，支持多种语言文本生成任务。

大型语言模型 Supports Multiple Languages

Kimi Dev 72B 4bit

Kimi-Dev-72B-4bit 是一个基于 moonshotai/Kimi-Dev-72B 转换的 4 位量化大语言模型，专为 MLX 框架优化。

大型语言模型 Other

Kimi Dev 72B 5bit

Kimi-Dev-72B-5bit 是一个基于 moonshotai/Kimi-Dev-72B 转换的 5 位量化大语言模型，适用于 Apple 设备的 MLX 框架。

大型语言模型 Other

Qwen3 Embedding 0.6B MXL 4bit

这是一个基于Qwen3-Embedding-0.6B模型转换的4位量化版本，专为MLX框架优化。

Diffucoder 7B Cpgrpo 8bit

DiffuCoder-7B-cpGRPO-8bit是一个转换为MLX格式的代码生成模型，基于apple/DiffuCoder-7B-cpGRPO转换而来，专为开发者提供高效的代码生成工具。

大型语言模型 Other

Diffucoder 7B Cpgrpo 6bit

DiffuCoder-7B-cpGRPO-6bit 是一个基于 MLX 格式转换的文本生成模型，专注于代码和文本扩散任务。

大型语言模型 Other

ERNIE 4.5 21B A3B PT 8bit

ERNIE-4.5-21B-A3B-PT-8bit 是百度 ERNIE-4.5-21B-A3B-PT 模型的 8 位量化版本，转换为 MLX 格式，适用于苹果芯片设备。

大型语言模型 Supports Multiple Languages

Diffucoder 7B Cpgrpo 4bit

DiffuCoder-7B-cpGRPO-4bit 是一个基于苹果 DiffuCoder-7B-cpGRPO 模型转换而来的 4 位量化版本，专为 MLX 框架优化。

大型语言模型 Other

Hunyuan A13B Instruct 5bit

基于腾讯混元A13B大模型转换的5bit量化版本，适用于苹果芯片的MLX框架

大型语言模型

Hunyuan A13B Instruct 4bit

腾讯混元A13B大语言模型的4bit量化版本，适用于指令跟随任务

大型语言模型

ERNIE 4.5 0.3B PT Bf16

ERNIE-4.5-0.3B-PT-bf16 是由百度开发的 ERNIE 系列模型的一个版本，参数规模为 0.3B，使用 bf16 精度进行训练。

大型语言模型 Supports Multiple Languages

Jan-nano-8bit 是基于 Menlo/Jan-nano 模型转换而来的 8 位量化版本，专为 MLX 框架优化，适用于文本生成任务。

大型语言模型

Qwen3 235B A22B 4bit DWQ 053125

这是一个基于Qwen3-235B-A22B-8bit模型转换而来的4位量化版本，专为MLX框架优化，适用于文本生成任务。

大型语言模型

Josiefied DeepSeek R1 0528 Qwen3 8B Abliterated V1 Bf16

这是一个基于MLX格式转换的大语言模型，适用于文本生成任务。

大型语言模型

Josiefied DeepSeek R1 0528 Qwen3 8B Abliterated V1 8bit

这是一个基于DeepSeek-R1-0528-Qwen3-8B模型转换的MLX格式8位量化版本，适用于文本生成任务。

大型语言模型

Deepseek R1 0528 Qwen3 8B Bf16

该模型是基于 deepseek-ai/deepseek-r1-0528-Qwen3-8B 转换的 MLX 格式版本，适用于苹果设备的本地推理。

大型语言模型

Llama 3.3 70B Instruct 4bit DWQ

基于Llama 3.3 70B指令微调模型的4位DWQ量化版本，适用于MLX框架的高效推理

大型语言模型 Supports Multiple Languages

Devstral Small 2505 4bit DWQ

这是一个基于MLX格式的4位量化语言模型，适用于文本生成任务。

大型语言模型 Supports Multiple Languages

Devstral Small 2505 Bf16

Devstral-Small-2505-bf16 是一个基于 MistralAI 的 Devstral-Small-2505 模型转换而来的 MLX 格式模型，支持多种语言处理任务。

大型语言模型 Supports Multiple Languages

Devstral Small 2505 8bit

Devstral-Small-2505-8bit 是一个基于 mistralai/Devstral-Small-2505 转换的 8 位量化模型，适用于 MLX 框架，支持多种语言的文本生成任务。

大型语言模型 Supports Multiple Languages

Medgemma 27b Text It Bf16

MedGemma-27B-Text-IT-BF16 是一个基于 MLX 格式转换的大型语言模型，专注于医疗健康领域的文本处理任务。

大型语言模型

Medgemma 27b Text It 8bit

MedGemma是基于Google开发的医疗领域大语言模型，专注于临床推理和医疗文本生成任务。

大型语言模型

Medgemma 27b Text It 4bit

MedGemma-27B-Text-IT-4bit是基于Google的MedGemma-27B-Text-IT模型转换而来的MLX格式模型，专为医疗和临床推理任务优化。

大型语言模型

Medgemma 4b It 8bit

MedGemma-4B-IT-8bit是Google MedGemma模型的MLX格式转换版本，专注于医疗领域的视觉语言任务。

图像生成文本

Medgemma 4b It 4bit

MedGemma-4B-IT-4bit 是一个专为医学领域设计的视觉语言模型，支持图像和文本处理，适用于医学图像分析等任务。

图像生成文本

Qwen3 32B 4bit DWQ

Qwen3-32B-8bit是基于Qwen3-32B模型量化的8位版本，适用于文本生成任务，由mlx-community发布。

大型语言模型

Gemma 3 27b It 4bit DWQ

这是一个基于Google Gemma 3 27B IT模型转换的4位量化版本，专为MLX框架优化。

大型语言模型

Gemma 3 4b It 4bit DWQ

基于Google Gemma-3-4b-it模型转换的4位DWQ量化MLX格式版本，提供高效的文本生成能力

大型语言模型

Gemma 3 12b It 4bit DWQ

Gemma 3 12B模型的4位量化版本，适用于MLX框架，支持高效文本生成任务。

大型语言模型

Qwen3 4B 4bit DWQ

该模型是Qwen3-4B的4位DWQ量化版本，转换为MLX格式，方便使用mlx库进行文本生成。

大型语言模型

Qwen3 30B A3B 4bit DWQ 05082025

这是一个基于Qwen/Qwen3-30B-A3B转换至MLX格式的4位量化模型，适用于文本生成任务。

大型语言模型

Spark TTS 0.5B 8bit

这是一个基于MLX格式的文本转语音模型，支持英文和中文，由prince-canuma/Spark-TTS-0.5B转换而来。

语音合成 Supports Multiple Languages

Qwen3 30B A3B 4bit DWQ 0508

Qwen3-30B-A3B-4bit-DWQ-0508是基于Qwen/Qwen3-30B-A3B转换至MLX格式的4位量化模型，适用于文本生成任务。

大型语言模型

Phi 4 Mini Reasoning MLX 4bit

这是一个基于微软Phi-4-mini-reasoning模型转换的MLX格式4位量化版本，适用于文本生成任务。

大型语言模型

lmstudio-community

Josiefied Qwen3 1.7B Abliterated V1 4bit

基于Qwen3-1.7B的4位量化版本，适用于MLX框架的轻量级大语言模型

大型语言模型

Qwen3 30B A3B MLX 8bit

该模型是基于Qwen/Qwen3-30B-A3B转换而来的MLX格式模型，支持8位量化，适用于文本生成任务。

大型语言模型

lmstudio-community

Qwen3-8B-bf16 是基于 Qwen/Qwen3-8B 转换的 MLX 格式模型，支持文本生成任务。

大型语言模型

Qwen3 30B A3B 8bit

Qwen3-30B-A3B-8bit 是 Qwen/Qwen3-30B-A3B 模型的 MLX 格式转换版本，支持在 Apple 芯片上高效运行。

大型语言模型

Featured Recommended AI Models

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers Supports Multiple Languages

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers English

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统 Chinese

AIbase

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご

© 2025AIbase