Pinkpixel Crystal Think V2 GGUF
Apache-2.0
這是一個對PinkPixel的Crystal-Think-V2模型進行的量化處理版本,提供多種量化類型以滿足不同硬件和性能需求。
大型語言模型 英語
P
bartowski
128
1
Gryphe Codex 24B Small 3.2 GGUF
Apache-2.0
這是Gryphe的Codex-24B-Small-3.2模型的量化版本,通過量化技術優化了在不同硬件條件下的運行效率。
大型語言模型 英語
G
bartowski
626
3
Mistralai Mistral Small 3.2 24B Instruct 2506 GGUF
Apache-2.0
這是Mistral-Small-3.2-24B-Instruct-2506模型的Llamacpp imatrix量化版本,提供多種量化類型以滿足不同硬件需求。
大型語言模型 支持多種語言
M
bartowski
3,769
12
Menlo Jan Nano GGUF
Apache-2.0
基於llama.cpp對Menlo/Jan - nano模型進行量化處理,提供多種量化類型的模型文件,以滿足不同硬件和性能需求。
大型語言模型
M
bartowski
190
1
Cognitivecomputations Qwen3 72B Embiggened GGUF
Apache-2.0
基於cognitivecomputations/Qwen3-72B-Embiggened模型的量化版本,使用llama.cpp進行量化處理,可在多種環境下高效運行。
大型語言模型
C
bartowski
826
1
BAAI RoboBrain2.0 7B GGUF
Apache-2.0
這是BAAI的RoboBrain2.0-7B模型的量化版本,通過llama.cpp進行量化處理,提供多種量化類型以適應不同硬件需求。
大型語言模型
B
bartowski
448
3
Akhil Theerthala Kuvera 8B V0.1.0 GGUF
MIT
Kuvera-8B是一個專注於金融和個人理財領域的8B參數大語言模型,提供多種量化版本以適應不同硬件需求。
大型語言模型 英語
A
bartowski
793
1
Xlangai Jedi 7B 1080p GGUF
Apache-2.0
這是一個使用llama.cpp進行量化的Jedi - 7B - 1080p模型,提供了多種量化類型供用戶選擇,以平衡文件大小和模型質量。
大型語言模型 英語
X
bartowski
225
1
E N V Y Legion V2.1 LLaMa 70B Elarablated V0.8 Hf GGUF
Legion-V2.1-LLaMa-70B-Elarablated-v0.8-hf是基於LLaMa-70B的量化版本,採用llama.cpp進行優化,提供多種量化選項以適應不同硬件需求。
大型語言模型
E
bartowski
267
1
Nvidia Llama 3.1 Nemotron Nano 4B V1.1 GGUF
其他
基於NVIDIA Llama-3.1-Nemotron-Nano-4B-v1.1模型的量化版本,使用llama.cpp工具進行多種量化處理,適合在資源受限的環境中運行。
大型語言模型 英語
N
bartowski
2,553
8
Qwen2.5 Omni 7B GPTQ Int4
其他
Qwen2.5-Omni 是一個端到端的多模態模型,能夠感知文本、圖像、音頻和視頻等多種模態,並以流式方式生成文本和自然語音響應。
多模態融合
Transformers 英語

Q
Qwen
389
8
Gemma 3 12B FornaxV.2 QAT CoT Q4 0 GGUF
這是一個實驗性的小型思維模型,旨在8GiB消費級顯卡上運行,具備通用推理能力。通過監督微調(SFT)和高質量推理軌跡訓練,模型能夠將推理能力泛化至多種任務。
大型語言模型
G
ConicCat
98
1
Huihui Ai Qwen3 14B Abliterated GGUF
Apache-2.0
Qwen3-14B-abliterated是基於Qwen3-14B模型的量化版本,使用llama.cpp進行優化,提供多種量化選項以適應不同性能需求。
大型語言模型
H
bartowski
6,097
5
Qwen Qwen3 32B GGUF
Apache-2.0
基於Qwen/Qwen3-32B的量化版本,使用llama.cpp進行量化,支持多種量化類型,適用於不同硬件需求。
大型語言模型
Q
bartowski
49.13k
35
Qwen Qwen3 1.7B GGUF
基於Qwen/Qwen3-1.7B的量化版本,使用llama.cpp進行量化,支持多種量化類型,適用於文本生成任務。
大型語言模型
Q
bartowski
7,150
10
Qwen Qwen3 4B GGUF
Qwen團隊提供的Qwen3-4B的Llamacpp imatrix量化版本,支持多種量化類型,適用於文本生成任務。
大型語言模型
Q
bartowski
10.58k
9
Qwen Qwen3 30B A3B GGUF
Apache-2.0
基於Qwen/Qwen3-30B-A3B的量化版本,使用llama.cpp進行多種精度量化,適用於文本生成任務。
大型語言模型
Q
bartowski
79.34k
49
Llama 3.2 1B Instruct GGUF
Llama-3.2-1B-Instruct 是一個基於 Llama 架構的 1B 參數量的指令微調模型,提供多種量化格式以適應不同硬件需求。
大型語言模型 支持多種語言
L
Mungert
708
3
Tesslate Tessa Rust T1 7B GGUF
Apache-2.0
Tessa-Rust-T1-7B的量化版本,使用llama.cpp工具進行量化處理,支持在不同硬件條件下高效運行。
大型語言模型
Transformers 英語

T
bartowski
542
2
Vicoder Html 32B Preview GGUF
ViCoder-HTML-32B-preview是一款強大的AI模型,專為生成完整網站而設計,包括HTML、Tailwind CSS和JavaScript代碼。
大型語言模型 其他
V
vicharai
130
4
Abomimegadarkgasinalgottenevereamession
這是一個基於DARE TIES方法合併的12B參數語言模型,融合了多個預訓練模型,旨在提供強大的文本生成能力。
大型語言模型
Transformers

A
ReadyArt
26
1
Qwen2.5 72B Instruct GGUF
其他
Qwen2.5-72B-Instruct的GGUF量化版本,支持多種精度格式,適用於不同硬件環境的高效推理。
大型語言模型 英語
Q
Mungert
1,439
4
Llama 2 7b Chat Hf GGUF
Llama 2是由Meta開發的7B參數規模的大語言模型,提供多種量化版本以適應不同硬件需求。
大型語言模型 英語
L
Mungert
1,348
3
Mxbai Rerank Large V2 GGUF
Apache-2.0
mxbai-rerank-large-v2是一個多語言文本重排序模型,支持多種語言和多種量化格式,適用於不同硬件環境。
文本嵌入 支持多種語言
M
Mungert
2,209
2
Phi 4 GGUF
MIT
phi-4是微軟研究院開發的開源語言模型,專注於高質量數據和推理能力,適用於內存/計算受限環境。
大型語言模型 支持多種語言
P
Mungert
1,508
3
Meta Llama 3 8B GGUF
Meta-Llama-3-8B 是一個基於 GGUF 格式的 8B 參數大語言模型,支持多種量化版本,適用於不同硬件環境。
大型語言模型 英語
M
Mungert
1,303
2
RWKV7 Goose World3 2.9B HF GGUF
Apache-2.0
基於flash-linear attention格式的RWKV-7模型,支持多語言文本生成任務。
大型語言模型 支持多種語言
R
Mungert
14.51k
16
Rwkv7 2.9B World GGUF
Apache-2.0
RWKV-7架構的29億參數大語言模型,支持多語言文本生成任務
大型語言模型 支持多種語言
R
Mungert
748
3
Wan 1.3b Gguf
Apache-2.0
這是一個基於Wan-AI/Wan2.1-T2V-1.3B的gguf量化版本,專為文本生成視頻任務設計,兼容comfyui-gguf和gguf節點。
文本生成視頻 英語
W
calcuis
3,058
12
Thedrummer Cydonia 24B V2.1 GGUF
其他
Cydonia-24B-v2.1是一個24B參數的大語言模型,經過llama.cpp的imatrix量化處理,提供多種量化版本以適應不同硬件需求。
大型語言模型
T
bartowski
4,417
7
Rombo Org Rombo LLM V3.1 QWQ 32b GGUF
Apache-2.0
Rombo-LLM-V3.1-QWQ-32b是一個32B參數規模的大型語言模型,經過llama.cpp的imatrix量化處理,提供多種量化版本以適應不同硬件需求。
大型語言模型
R
bartowski
2,132
5
Mochi Gguf
Apache-2.0
mochi的gguf量化版本是一個文本生成視頻的模型,包含gguf編碼器和gguf變分自編碼器,適用於快速生成視頻內容。
文本生成視頻 英語
M
calcuis
284
2
Thedrummer Cydonia 24B V2 GGUF
其他
這是一個24B參數的大語言模型,經過llama.cpp的imatrix量化處理,提供多種量化版本以適應不同硬件需求。
大型語言模型
T
bartowski
5,797
16
Zed Industries Zeta GGUF
Apache-2.0
這是對zed-industries的zeta模型進行的Llamacpp imatrix量化版本,解決了在不同硬件條件下高效運行模型的問題,提供了多種量化類型供用戶選擇。
大型語言模型
Z
bartowski
561
12
Nera Noctis 12B GGUF
其他
Nera_Noctis-12B的Llamacpp imatrix量化版本,基於Nitral-AI/Nera_Noctis-12B模型,支持英文文本生成任務。
大型語言模型 英語
N
bartowski
64
6
Aura 4B GGUF
Apache-2.0
Aura-4B是一個基於AuraIndustries/Aura-4B的量化版本,使用llama.cpp進行imatrix量化,支持多種量化類型,適用於文本生成任務。
大型語言模型 英語
A
bartowski
290
8
Mochi
Apache-2.0
mochi是一個基於gguf量化版本的文本生成視頻模型,支持通過文本描述生成視頻內容。
文本生成視頻 英語
M
calcuis
140
8
Starcoder2 3b GGUF
Openrail
StarCoder2-3B是一個擁有30億參數的代碼生成模型,基於17種編程語言數據訓練,能夠生成代碼片段但可能不完全準確。
大型語言模型
Transformers

S
nold
300
1
Mixtral 8x7B V0.1
Apache-2.0
Mixtral-8x7B是一個預訓練的生成式稀疏混合專家模型,在多數基準測試中表現優於Llama 2 70B。
大型語言模型
Transformers 支持多種語言

M
mistralai
42.78k
1,709
Starcoder2 3b
Openrail
StarCoder2-3B是一個擁有30億參數的代碼生成模型,基於17種編程語言訓練而成,支持16,384標記的上下文窗口。
大型語言模型
Transformers 其他

S
bigcode
199.62k
178
- 1
- 2
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98