INTELLECT 2 GGUF
INTELLECT-2-GGUF 是 PrimeIntellect/INTELLECT-2 的 GGUF 格式量化版本,適用於文本生成任務。
大型語言模型
I
MaziyarPanahi
88
1
Qwen3 8B 4bit DWQ
Apache-2.0
Qwen3-8B-4bit-DWQ 是基於 Qwen/Qwen3-8B 轉換至 MLX 格式的 4 位量化版本,適用於在 Apple 設備上高效運行。
大型語言模型
Q
mlx-community
306
1
Qwen3 30B A3B MLX 4bit
Apache-2.0
Qwen3-30B-A3B-MLX-8bit 是基於 Qwen/Qwen3-30B-A3B 轉換的 8 位量化版本,專為 MLX 框架優化,適用於文本生成任務。
大型語言模型
Q
lmstudio-community
4,199
19
Gemma 3 12b It GGUF
Gemma 3 12B 的 GGUF 量化版本,適用於文本生成任務。
大型語言模型
G
MaziyarPanahi
641.41k
4
Pllum 8x7B Chat GGUF
Apache-2.0
PLLuM-8x7B-chat的GGUF量化版本,針對本地推理優化,支持多種量化級別以適應不同硬件需求。
大型語言模型
Transformers

P
piotrmaciejbednarski
126
2
Llama 3.2 3B Instruct Abliterated GGUF
Llama-3.2-3B-Instruct-abliterated的GGUF格式量化版本,支持多種比特量化選項,適用於文本生成任務。
大型語言模型
L
MaziyarPanahi
181
2
Llama 3.2 3B Instruct GGUF
Llama-3.2-3B-Instruct 模型的 GGUF 格式文件,方便用戶進行文本生成任務。
大型語言模型
L
MaziyarPanahi
203.56k
13
Phi 3.5 Mini Instruct GGUF
Phi-3.5-mini-instruct的GGUF格式模型文件,適用於文本生成任務。
大型語言模型
P
MaziyarPanahi
335.88k
13
Mistral Nemo Instruct 2407 GGUF
Mistral-Nemo-Instruct-2407-GGUF 是 mistralai/Mistral-Nemo-Instruct-2407 的 GGUF 格式量化版本,支持多種量化位數(2-bit 至 8-bit),適用於文本生成任務。
大型語言模型
M
MaziyarPanahi
441.17k
44
Deepseek V2 Lite IMat GGUF
DeepSeek-V2-Lite 的 GGUF 量化版本,通過 Llama.cpp imatrix 量化處理,減少存儲和計算資源需求,便於部署。
大型語言模型
D
legraphista
491
1
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98