Longwriter Zero 32B I1 GGUF
Apache-2.0
LongWriter-Zero-32B 量化模型基于 THU-KEG/LongWriter-Zero-32B 基础模型,支持中英双语,适用于强化学习、写作等长上下文场景。
大型语言模型
Transformers 支持多种语言

L
mradermacher
135
1
ICONNAI ICONN 1 GGUF
其他
ICONN-1的量化版本,提供多种量化选项以适应不同性能和质量需求
大型语言模型
I
bartowski
609
6
Mass Academy Faq Embedder I1 GGUF
本模型是ntproctor/mass-academy-faq-embedder的量化版本,提供多种量化类型选择,适用于高效的特征提取和句子相似度计算。
文本嵌入
Transformers 英语

M
mradermacher
452
1
Qwen2 Audio 7B Instruct GGUF
Apache-2.0
Qwen2-Audio-7B-Instruct模型的静态量化版本,支持英文音频文本转文本任务
音频生成文本
Transformers 英语

Q
mradermacher
146
0
Facebook KernelLLM GGUF
其他
KernelLLM是Facebook开发的大语言模型,此版本为使用llama.cpp工具进行imatrix量化的版本,提供多种量化选项以适应不同硬件需求。
大型语言模型
F
bartowski
5,151
2
Wan2.1 14B VACE GGUF
Apache-2.0
Wan2.1-VACE-14B模型的GGUF格式版本,主要用于文本到视频的生成任务。
文本生成视频
W
QuantStack
146.36k
139
Thedrummer Snowpiercer 15B V1 GGUF
MIT
基于TheDrummer/Snowpiercer-15B-v1模型的量化版本,使用llama.cpp进行量化,适用于文本生成任务。
大型语言模型
T
bartowski
4,783
1
Mlabonne Qwen3 1.7B Abliterated GGUF
这是一个基于Qwen3-1.7B-abliterated模型的量化版本,使用llama.cpp进行量化,支持多种量化类型,适用于文本生成任务。
大型语言模型
M
bartowski
1,493
2
Josiefied Qwen3 4B Abliterated V1 Gguf
Apache-2.0
这是 Josiefied-Qwen3-4B-abliterated-v1 模型的 GGUF 量化版本,适用于本地部署和运行。
大型语言模型
J
Goekdeniz-Guelmez
4,518
7
Inclusionai Ling Lite 0415 GGUF
MIT
基于inclusionAI/Ling-lite的量化版本,使用llama.cpp进行imatrix量化,支持多种量化类型以适应不同硬件需求。
大型语言模型
I
bartowski
3,112
6
Deepcoder 14B Preview Exl2
DeepCoder-14B-Preview是基于DeepSeek-R1-Distill-Qwen-14B开发的代码生成模型,专注于可验证编程问题的解决。
大型语言模型 英语
D
cgus
46
2
Beaver 7b V3.0 GGUF
Beaver-7B-v3.0 是一个基于 LLaMA 架构的 7B 参数大语言模型,专注于安全性和人类反馈强化学习(RLHF)。
大型语言模型 英语
B
mradermacher
405
1
Orpheus Bangla GGUF
Apache-2.0
这是asif00/orpheus-bangla-tts模型的静态量化版本,支持孟加拉语文本转语音任务。
语音合成 其他
O
mradermacher
416
0
Lightblue Reranker 0.5 Bincont Filt Gguf
这是一个文本排序模型,用于对文本进行相关性排序。
文本嵌入
L
RichardErkhov
2,054
0
Lightblue Reranker 0.5 Cont Gguf
这是一个文本排序模型,用于对文本进行重新排序和评分。
文本嵌入
L
RichardErkhov
1,986
0
Jbaron34 Qwen2.5 0.5b Bebop Reranker Newer Small Gguf
基于Qwen2.5架构的0.5亿参数文本排序模型,适用于信息检索和文档排序任务
大型语言模型
J
RichardErkhov
2,117
0
Jbaron34 Qwen2.5 0.5b Bebop Reranker New Small Gguf
基于Qwen2.5架构的0.5B参数规模的文本排序模型,适用于重排序任务。
大型语言模型
J
RichardErkhov
2,454
0
Hyvid I2v Gguf
其他
腾讯混元社区开发的图像转视频模型,能够将输入的文本描述转换为动态视频内容。
视频处理 英语
H
calcuis
1,212
6
Pllum 8x7B Chat GGUF
Apache-2.0
PLLuM-8x7B-chat的GGUF量化版本,针对本地推理优化,支持多种量化级别以适应不同硬件需求。
大型语言模型
Transformers

P
piotrmaciejbednarski
126
2
Gte Qwen2 7B Instruct GGUF
Apache-2.0
阿里巴巴NLP团队开发的7B参数规模的多语言文本嵌入模型,专注于句子相似度任务,提供多种量化版本
大型语言模型 英语
G
mradermacher
510
2
Heackmt5 ZhSum100k GGUF
基于mT5架构的中文摘要生成模型,提供多种量化版本
文本生成 中文
H
mradermacher
60
0
Greek Text Summarization GGUF
Apache-2.0
基于kriton/greek-text-summarization的静态量化版本,专注于希腊语文本摘要任务
文本生成 其他
G
mradermacher
216
0
Deepthink Reasoning 7B GGUF
Openrail
Deepthink-Reasoning-7B的Llamacpp imatrix量化版本,提供多种量化类型选择以适应不同硬件需求
大型语言模型 英语
D
bartowski
1,180
3
Smolmaestra 1.7b Translation GGUF
Apache-2.0
SmolMaestra-1.7b-Translation是一个1.7B参数的翻译模型,支持英语和意大利语之间的翻译任务。
机器翻译 支持多种语言
S
tensorblock
406
1
Aura 4B GGUF
Apache-2.0
Aura-4B是一个基于AuraIndustries/Aura-4B的量化版本,使用llama.cpp进行imatrix量化,支持多种量化类型,适用于文本生成任务。
大型语言模型 英语
A
bartowski
290
8
Aion RP Llama 3.1 8B GGUF
Apache-2.0
Aion-RP-Llama-3.1-8B的Llamacpp imatrix量化版本,提供多种量化选项以适应不同硬件需求。
大型语言模型
A
bartowski
159
1
FLUX.1 Canny Dev GGUF
其他
FLUX.1-Canny-dev 是一个基于文本生成图像的模型,专注于图像生成任务。
文本生成图像 英语
F
second-state
676
12
Stable Diffusion 3.5 Medium GGUF
其他
Stable Diffusion 3.5 Medium 的 GGUF 量化版本,支持文本到图像生成任务。
文本生成图像 英语
S
second-state
3,333
8
Llama Mesh GGUF
LLaMA-Mesh是一个基于LLaMA架构的文本转3D模型,专注于网格生成任务。该版本是使用llama.cpp进行量化的版本,提供了多种量化选项以适应不同硬件需求。
文本生成图像
L
bartowski
1,911
30
Stable Diffusion 3.5 Large GGUF
其他
Stable Diffusion 3.5 Large 是一个强大的文本生成图像模型,基于扩散模型架构,能够根据文本描述生成高质量的图像。
文本生成图像 英语
S
second-state
2,422
3
Qwen2.5 Coder 1.5B GGUF
Apache-2.0
Qwen2.5-Coder-1.5B 是一个1.5B参数的代码生成模型,支持多种编程语言,适用于代码补全和生成任务。
大型语言模型
Transformers 支持多种语言

Q
tensorblock
162
1
LLAMA 3 8B Unaligned BETA GGUF
基于LLaMA-3架构的8B参数未对齐测试版模型,提供多种量化版本以适应不同硬件需求
大型语言模型
L
bartowski
542
10
FLUX.1 Dev GGUF
其他
FLUX.1-dev 是一个文本生成图像的扩散模型,由 black-forest-labs 开发,支持通过文本提示生成高质量图像。
文本生成图像 英语
F
second-state
2,211
8
Thusinh1969 Gemma2 2b Rerank Checkpoint 8800 Gguf
基于Gemma 2B架构的文本排序模型,提供多种量化版本以适应不同硬件需求
文本排序
T
RichardErkhov
71
0
Chewy Lemon Cookie 11B GGUF
Chewy-Lemon-Cookie-11B 是一个基于 Mistral 架构的 11B 参数大语言模型,专注于文本生成和角色扮演任务。
大型语言模型 英语
C
mradermacher
296
2
Wizardlm 2 7B Abliterated GGUF
Apache-2.0
WizardLM-2-7B-abliterated的Llamacpp imatrix量化版本,提供多种量化选项,适用于不同硬件配置。
大型语言模型
W
bartowski
2,561
13
Mistral 7B Instruct V0.3 GGUF
Apache-2.0
Mistral-7B-Instruct-v0.3 是基于 Mistral-7B-v0.3 进行指令微调的大型语言模型,支持函数调用和扩展词汇表。
大型语言模型
M
SanctumAI
34.61k
9
Phi 3 Mini 128k Instruct Function GGUF
Phi-3-mini-128k-instruct_function 是一个基于 GGUF 格式量化的文本生成模型,支持多种量化级别。
大型语言模型
P
afrideva
40
1
Orcamaid V3 13B 32k GGUF
其他
Orcamaid v3 13B 32K 是一个基于 Llama 架构的大语言模型,支持 32K 序列长度,适用于文本生成任务。
大型语言模型
Transformers

O
TheBloke
163
17
Law LLM 13B GGUF
其他
Law LLM 13B是基于LLaMA-1-13B开发的特定领域基础模型,专注于法律领域的任务。
大型语言模型
Transformers 英语

L
TheBloke
420
8
- 1
- 2
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers 支持多种语言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers 英语

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统 中文
R
uer
2,694
98