Deepseek R1 0528 4bit
DeepSeek-R1-0528-4bit 是一个基于 DeepSeek-R1-0528 转换而来的 4 位量化模型,专为 MLX 框架优化。
大型语言模型
D
mlx-community
157
9
GLM 4 32B 0414 4bit DWQ
MIT
这是THUDM/GLM-4-32B-0414模型的MLX格式版本,经过4位DWQ量化处理,适用于苹果芯片设备的高效推理。
大型语言模型 支持多种语言
G
mlx-community
156
4
Goekdeniz Guelmez Josiefied Qwen3 8B Abliterated V1 GGUF
这是Qwen3-8B模型的量化版本,使用llama.cpp进行imatrix量化,适用于聊天场景。
大型语言模型
G
bartowski
7,520
12
Qwen3 30B A3B 4bit DWQ
Apache-2.0
这是一个基于Qwen3-30B-A3B模型的4位量化版本,通过从6位量化蒸馏至4位定制的DWQ量化技术制作,适用于文本生成任务。
大型语言模型
Q
mlx-community
561
19
Josiefied Qwen3 8B Abliterated V1 8bit
基于Qwen3-8B优化的8位量化版本,适用于MLX框架的高效推理
大型语言模型
J
mlx-community
450
1
Josiefied Qwen3 4B Abliterated V1 4bit
这是一个基于Qwen3-4B模型转换到MLX格式的4位量化版本,适用于文本生成任务。
大型语言模型
J
mlx-community
175
1
GLM 4 32B 0414 4bit
MIT
GLM-4-32B-0414-4bit 是基于 THUDM/GLM-4-32B-0414 转换而来的 MLX 格式模型,支持中英文文本生成任务。
大型语言模型 支持多种语言
G
mlx-community
361
3
Tesslate Tessa T1 3B GGUF
Apache-2.0
Tessa-T1-3B是基于Qwen2架构的3B参数大语言模型,提供多种量化版本以适应不同硬件需求。
大型语言模型 英语
T
bartowski
697
6
Pivot 0.1 Early
PiVoT是基于Mistral 7B微调的模型,从Synatra v0.3 RP衍生出的变体,展现出不错的性能表现。
大型语言模型
Transformers 支持多种语言

P
maywell
1,851
8
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers 支持多种语言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers 英语

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统 中文
R
uer
2,694
98