# 轻量部署

Midm 2.0 Base Instruct Gguf
MIT
Mi:dm 2.0 是采用 KT 专有技术开发的'以韩国为中心的 AI'模型,深度内化了韩国社会独特的价值观、认知框架和常识推理。
大型语言模型 Transformers 支持多种语言
M
mykor
517
1
Tencent.hunyuan A13B Instruct GGUF
腾讯混元A13B指令模型的量化版本,通过技术手段在保证性能的同时提升运行效率。
大型语言模型
T
DevQuasar
402
1
Fpham Sydney Overthinker 13b HF GGUF
该项目提供了优化后的GGUF量化文件,可显著提升模型性能。这些量化文件由Featherless AI提供支持,用户只需支付少量费用,即可运行任意所需模型。
大型语言模型
F
featherless-ai-quants
133
1
Josiefied DeepSeek R1 0528 Qwen3 8B Abliterated V1 8bit
这是一个基于DeepSeek-R1-0528-Qwen3-8B模型转换的MLX格式8位量化版本,适用于文本生成任务。
大型语言模型
J
mlx-community
847
1
Deepseek R1 0528 Qwen3 8B 4bit
MIT
该模型是基于DeepSeek-R1-0528-Qwen3-8B转换的4位量化版本,专为MLX框架优化,适用于文本生成任务。
大型语言模型
D
mlx-community
924
1
Devstral Small 2505 GGUF
Apache-2.0
Devstral-Small-2505的量化版本,提供多种精度选择以适应不同硬件需求
大型语言模型 支持多种语言
D
Antigma
170
1
Sam Reason S2.1 GGUF
MIT
Sam-reason-S2.1的静态量化版本,提供多种量化选项以适应不同硬件需求
大型语言模型 英语
S
mradermacher
299
1
INTELLECT 2 GGUF
INTELLECT-2-GGUF 是 PrimeIntellect/INTELLECT-2 的 GGUF 格式量化版本,适用于文本生成任务。
大型语言模型
I
MaziyarPanahi
88
1
Qwen3 4B 4bit DWQ
Apache-2.0
该模型是Qwen3-4B的4位DWQ量化版本,转换为MLX格式,方便使用mlx库进行文本生成。
大型语言模型
Q
mlx-community
517
2
Huihui Ai.qwen3 4B Abliterated GGUF
慧慧AI的Qwen3-4B模型的量化版本,旨在让知识更广泛地被大众获取。
大型语言模型
H
DevQuasar
540
1
Josiefied Qwen3 4B Abliterated V1 6bit
这是一个基于Qwen3-4B模型转换至MLX格式的6位量化版本,适用于文本生成任务。
大型语言模型
J
mlx-community
15
1
Qwen3 8B 4bit DWQ
Apache-2.0
Qwen3-8B-4bit-DWQ 是基于 Qwen/Qwen3-8B 转换至 MLX 格式的 4 位量化版本,适用于在 Apple 设备上高效运行。
大型语言模型
Q
mlx-community
306
1
Mlabonne Qwen3 4B Abliterated GGUF
Qwen3-4B-abliterated的量化版本,使用llama.cpp进行量化,支持多种量化类型,适用于文本生成任务。
大型语言模型
M
bartowski
3,623
3
Josiefied Qwen3 1.7B Abliterated V1 4bit
基于Qwen3-1.7B的4位量化版本,适用于MLX框架的轻量级大语言模型
大型语言模型
J
mlx-community
135
2
Qwen3 8B 4bit
Apache-2.0
这是Qwen/Qwen3-8B模型的4位量化版本,已转换为MLX框架格式,适用于苹果芯片设备的高效推理。
大型语言模型
Q
mlx-community
2,131
2
Qwen3 4B 4bit
Apache-2.0
Qwen3-4B-4bit 是从 Qwen/Qwen3-4B 转换至 MLX 格式的 4 位量化版本,适用于在 Apple 芯片上高效运行。
大型语言模型
Q
mlx-community
7,400
6
Internvl2 5 1B MNN
Apache-2.0
基于InternVL2_5-1B的4位量化版本,适用于文本生成和聊天场景
大型语言模型 英语
I
taobao-mnn
2,718
1
Jungzoona T3Q Qwen2.5 14b V1.0 E3 GGUF
Apache-2.0
本仓库包含JungZoona/T3Q-qwen2.5-14b-v1.0-e3的GGUF格式模型文件,由TensorBlock提供的机器进行量化,兼容llama.cpp。
大型语言模型 Transformers 支持多种语言
J
tensorblock
557
1
Deepcogito Cogito V1 Preview Llama 3B GGUF
基于Llama架构的3B参数语言模型,提供多种量化版本以适应不同硬件需求
大型语言模型
D
tensorblock
162
1
Llama381binstruct Summarize Short Merged
其他
基于Meta-Llama-3.1-8B-Instruct的合并模型,针对法律领域摘要任务进行了微调,能将法律术语转换为简短易懂的摘要。
大型语言模型
L
FlamingNeuron
42
0
GLM Z1 9B 0414
MIT
GLM-4-Z1-9B-0414是GLM家族的新一代开源模型,具备优秀的数学推理与通用能力,适合资源受限场景下的轻量部署。
大型语言模型 Transformers 支持多种语言
G
THUDM
3,456
55
Xlm Roberta Base Language Detection Tfjs
MIT
这是一个基于XLM-RoBERTa的多语言检测模型,支持20种语言的识别。
文本分类 支持多种语言
X
dnouv
14
1
Gemma 3 27b It Abliterated Mlx 3Bit
这是一个基于mlabonne/gemma-3-27b-it-abliterated模型转换的3位量化版本,专为MLX框架优化。
大型语言模型 Transformers
G
KYUNGYONG
129
0
Lightblue Reranker 0.5 Cont Filt 7max Gguf
这是一个文本排序模型,用于对文本进行相关性排序。
文本嵌入
L
RichardErkhov
2,106
0
Qwen.qwen2 VL 7B GGUF
Qwen2-VL-7B的量化版本,致力于让知识为每个人所用。
图像生成文本
Q
DevQuasar
142
0
Traceback 12b
Apache-2.0
TraceBack 12b 是基于 Mistral-Nemo-Instruct 架构的 4bit 量化版本,专注于指令遵循和思维链推理任务。
大型语言模型 Transformers
T
secemp9
1,470
29
Chroma GGUF
Apache-2.0
Chroma-GGUF 是一个基于 lodestones/Chroma 的量化模型集合,提供多种不同精度的量化版本,适用于不同的硬件和性能需求。
图像生成
C
silveroxides
8,529
20
Ozone Ai 0x Lite GGUF
Apache-2.0
基于ozone-ai/0x-lite模型的量化版本,支持中英文文本生成任务,采用llama.cpp进行imatrix量化,提供多种量化选项以适应不同硬件需求。
大型语言模型 支持多种语言
O
bartowski
220
2
Janus Pro 1B 4bit
MIT
基于deepseek-ai/Janus-Pro-1B的4位量化版本,适用于Apple芯片的MLX框架
大型语言模型
J
wnma3mz
40
3
Huihui Ai.deepseek R1 Distill Qwen 32B Abliterated GGUF
这是一个量化版本的大语言模型,旨在让知识更易于获取和使用。
大型语言模型
H
DevQuasar
572
3
Meno Tiny 0.1
Apache-2.0
基于Qwen2.5-1.5B-Instruct微调的俄语指令优化模型,15亿参数,支持俄英双语,擅长RAG流程中的文本问答
大型语言模型 Transformers 支持多种语言
M
bond005
764
10
Llama 3.2 3B Instruct GGUF
Llama-3.2-3B-Instruct 模型的 GGUF 格式文件,方便用户进行文本生成任务。
大型语言模型
L
MaziyarPanahi
203.56k
13
FLUX.1 Schnell GGUF
Apache-2.0
FLUX.1-schnell 是一个高效的文本生成图像模型,基于扩散模型架构,支持英文文本输入生成高质量图像。
文本生成图像 英语
F
second-state
551
11
FLUX.1 Schnell GGUF
Apache-2.0
FLUX.1-schnell的.gguf量化版本,用于文本到图像的转换任务
文本生成图像
F
OlegSkutte
121
4
Bge M3 GGUF
MIT
该模型是通过ggml.ai的GGUF-my-repo空间,使用llama.cpp从BAAI/bge-m3转换为GGUF格式的句子相似度模型。
文本嵌入
B
bbvch-ai
266
1
Moralbert Predict Subversion In Lyrics
MIT
这是一个基于PyTorch的文本分类模型,适用于多种文本分类任务。
文本分类 Transformers
M
vjosap
17
1
Mistral Nemo Instruct 2407 GGUF
Mistral-Nemo-Instruct-2407-GGUF 是 mistralai/Mistral-Nemo-Instruct-2407 的 GGUF 格式量化版本,支持多种量化位数(2-bit 至 8-bit),适用于文本生成任务。
大型语言模型
M
MaziyarPanahi
441.17k
44
Omost Dolphin 2.9 Llama3 8b 4bits
Omost发布的基于Llama3-8B的指令微调模型,采用Dolphin-2.9数据集预训练,并以4位NF4格式量化。
大型语言模型 Transformers
O
lllyasviel
106
6
Omost Llama 3 8b 4bits
Omost 发布的 llama-3 模型,具有 8k 上下文长度,采用 nf4 量化。
大型语言模型 Transformers
O
lllyasviel
1,163
21
Openchat 3.6 8b 20240522 IMat GGUF
这是对 openchat/openchat-3.6-8b-20240522 模型进行 Llama.cpp imatrix 量化处理后的版本,提供了不同量化类型的文件,方便用户根据需求下载和使用。
大型语言模型
O
legraphista
4,416
1
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase