# 大模型量化
Skywork Skywork SWE 32B GGUF
Apache-2.0
Skywork-SWE-32B是一個32B參數的大語言模型,經過Llamacpp imatrix量化,可在資源受限環境下高效運行。
大型語言模型
S
bartowski
921
2
Qwen.qwen3 Reranker 4B GGUF
Qwen3-Reranker-4B的量化版本,旨在降低資源消耗同時保持性能
大型語言模型
Q
DevQuasar
1,730
1
Google.gemma 3 12b Pt GGUF
這是一個基於google/gemma-3-12b-pt的量化版本模型,旨在通過量化技術讓大型模型更易於使用。
大型語言模型
G
DevQuasar
305
0
Google.gemma 3 27b It GGUF
基於谷歌Gemma-3-27b-it模型的量化版本,專注於圖像文本轉文本任務,致力於知識普及化
大型語言模型
G
DevQuasar
123
0
Gemma 3 27b It GGUF
Gemma-3-27b-it是Google發佈的27B參數規模的量化版本大語言模型,專注於圖像文本轉換任務。
大型語言模型
Transformers

G
gaianet
2,047
0
Huihui Ai.deepseek R1 Distill Qwen 32B Abliterated GGUF
這是一個量化版本的大語言模型,旨在讓知識更易於獲取和使用。
大型語言模型
H
DevQuasar
572
3
Llama 3.1 Nemotron 70B Instruct AWQ INT4
NVIDIA定製的70B參數大語言模型,通過AWQ Int4量化優化,在多個自動對齊基準測試中表現優異
大型語言模型
Transformers Supports Multiple Languages

L
joshmiller656
1,591
3
Wizardcoder Python 13B V1.0 GPTQ
WizardCoder Python 13B V1.0是由WizardLM開發的大語言模型,專注於Python代碼生成任務,基於llama2架構,在HumanEval基準測試中表現優異。
大型語言模型
Transformers

W
TheBloke
309
76
Featured Recommended AI Models
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers Supports Multiple Languages

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers English

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 Chinese
R
uer
2,694
98