ERNIE 4.5 0.3B PT GGUF
Apache-2.0
该模型是百度ERNIE-4.5-0.3B-PT的GGUF格式转换版本,支持中英文文本生成任务。
大型语言模型 支持多种语言
E
wqerrewetw
173
1
Jan Nano 8bit
Apache-2.0
Jan-nano-8bit 是基于 Menlo/Jan-nano 模型转换而来的 8 位量化版本,专为 MLX 框架优化,适用于文本生成任务。
大型语言模型
J
mlx-community
188
1
Huihui Ai.magistral Small 2506 Abliterated GGUF
慧慧AI量化模型是Magistral-Small-2506-abliterated的量化版本,致力于让知识为每个人所用。
大型语言模型
H
DevQuasar
423
1
Sentientagi.dobby Mini Unhinged Plus Llama 3.1 8B GGUF
本项目提供了Dobby-Mini-Unhinged-Plus-Llama-3.1-8B的量化版本,旨在让知识为每个人所用。
大型语言模型
S
DevQuasar
181
1
Dleemiller.penny 1.7B GGUF
Penny - 1.7B 是一个量化版本的大语言模型,致力于让知识为每个人所用。
大型语言模型
D
DevQuasar
113
1
Dmindai.dmind 1 Mini GGUF
DMind-1-mini 是一个轻量级的文本生成模型,适用于多种自然语言处理任务。
文本生成
D
DevQuasar
213
1
AM Thinking V1 GGUF
Apache-2.0
AM-Thinking-v1 是一个基于 GGUF 格式的文本生成模型,适用于多种自然语言处理任务。
大型语言模型
Transformers

A
Mungert
1,234
1
Hyperclovax SEED Text Instruct 0.5B GGUF
其他
基于llama.cpp生成的0.5B参数规模的文本生成模型,支持指令式文本生成任务
大型语言模型
H
Mungert
407
1
Mlabonne Qwen3 0.6B Abliterated GGUF
这是一个基于Qwen3-0.6B-abliterated模型的量化版本,使用llama.cpp进行量化,适用于文本生成任务。
大型语言模型
M
bartowski
1,455
2
Qwen3 4B GGUF
Apache-2.0
Qwen3-4B是基于Qwen3-4B-Base的GGUF格式模型,适用于文本生成任务。
大型语言模型
Q
Mungert
1,507
7
Qwen Qwen3 0.6B GGUF
Apache-2.0
本仓库包含Qwen/Qwen3-0.6B的GGUF格式模型文件,由TensorBlock提供的机器进行量化处理,兼容llama.cpp。
大型语言模型
Q
tensorblock
905
3
Qwen3 0.6B GGUF
Qwen3-0.6B的GGUF量化版本,适用于文本生成任务。
大型语言模型
Q
MaziyarPanahi
233.95k
2
Qwen Qwen3 0.6B GGUF
Qwen团队提供的Qwen3-0.6B的Llamacpp imatrix量化版本,使用llama.cpp进行量化,支持在LM Studio或基于llama.cpp的项目中运行。
大型语言模型
Q
bartowski
10.24k
14
Qwen2 96M
Apache-2.0
Qwen2-96M是基于Qwen2架构的微型语言模型,含9600万参数,支持8192个标记的上下文长度,适用于英文文本生成任务。
大型语言模型 英语
Q
Felladrin
76
2
Tesslate Tessa T1 3B GGUF
Apache-2.0
Tessa-T1-3B是基于Qwen2架构的3B参数大语言模型,提供多种量化版本以适应不同硬件需求。
大型语言模型 英语
T
bartowski
697
6
Llama 3.1 8B RainbowLight EtherealMix GGUF
这是一个基于Llama-3.1-8B-RainbowLight-EtherealMix模型的GGUF格式量化版本,便于进行文本生成相关的应用开发。
大型语言模型
L
MaziyarPanahi
101
1
Qwen2.5 1.5B Instruct GGUF
Qwen2.5-1.5B-Instruct 模型的 GGUF 格式文件,适用于文本生成任务。
大型语言模型
Q
MaziyarPanahi
183.11k
6
Yi Coder 1.5B Chat GGUF
Yi-Coder-1.5B-Chat-GGUF 是 01-ai/Yi-Coder-1.5B-Chat 的 GGUF 格式模型文件,适用于文本生成任务。
大型语言模型
Y
MaziyarPanahi
254.78k
10
Phi 3.5 Mini Instruct GGUF
Phi-3.5-mini-instruct的GGUF格式模型文件,适用于文本生成任务。
大型语言模型
P
MaziyarPanahi
335.88k
13
Gemma 2 2b It Abliterated GGUF
Gemma-2-2b-it-abliterated是一个基于Google Gemma架构的2.2B参数语言模型,经过量化处理,适用于文本生成任务。
大型语言模型 英语
G
bartowski
10.55k
60
Gemma 2 2b It
Gemma是Google推出的轻量级开放模型系列,基于创建Gemini模型的技术构建,适用于多种文本生成任务。
大型语言模型
Transformers

G
google
342.64k
1,064
Gemma 2 27b
Gemma是Google推出的轻量级开源大语言模型,基于与Gemini相同技术构建,适用于文本生成任务。
大型语言模型
Transformers

G
google
11.89k
207
Qwen1.5 Moe Tiny Random
这是一个基于Qwen1.5-MoE架构的随机初始化小型模型,采用float16精度,适用于文本生成任务。
大型语言模型
Transformers

Q
yujiepan
30
1
Phi 2 Super GGUF
MIT
phi-2-super-GGUF 是 abacaj/phi-2-super 模型的 GGUF 量化版本,适用于本地运行和文本生成任务。
大型语言模型
Transformers

P
MaziyarPanahi
158
5
Minueza 32M Base
Apache-2.0
Minueza-32M-Base是一个拥有3200万参数的基础模型,完全基于大量英文文本语料训练而成,适用于文本生成任务。
大型语言模型
Transformers 英语

M
Felladrin
68
18
Gemma 2b It GGUF
其他
Gemma 2B模型的GGUF量化版本,适用于本地部署和推理
大型语言模型
G
MaziyarPanahi
517
10
Gemma 2b
Gemma是Google推出的轻量级开源大语言模型系列,基于创建Gemini模型的技术构建,提供20亿参数的基础版本。
大型语言模型
G
google
402.85k
994
Phi2 Chinese 0.2B
Apache-2.0
基于Phi2架构的2亿参数中文因果语言模型,支持文本生成任务
大型语言模型
Transformers 支持多种语言

P
charent
65
30
Tinyllama V0 GGUF
MIT
TinyLLama-v0 是一个轻量级语言模型,基于 GGUF 格式提供,适用于文本生成任务。
大型语言模型 英语
T
aladar
72
2
Puma 3B
Apache-2.0
Puma-3B是基于OpenLLaMA 3B V2微调得到的文本生成模型,在ShareGPT Hyperfiltered数据集上训练,适用于多种文本生成任务。
大型语言模型
Transformers 英语

P
acrastt
427
4
Distilgpt2
Apache-2.0
DistilGPT2是GPT-2的轻量级蒸馏版本,拥有8200万参数,保留了GPT-2的核心文本生成能力,同时体积更小、速度更快。
大型语言模型 英语
D
distilbert
2.7M
527
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers 支持多种语言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers 英语

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统 中文
R
uer
2,694
98