# 量化高效推理

Microsoft.naturelm 8x7B Inst GGUF
NatureLM-8x7B-Inst的量化版本,旨在讓知識為每個人所用。
大型語言模型
M
DevQuasar
244
1
Wan2.1 T2V 14B LightX2V StepCfgDistill VACE GGUF
Apache-2.0
萬2.1文本到視頻模型的GGUF格式轉換版本,支持文本到視頻、圖像到視頻和視頻到視頻的轉換,經過量化處理以提高運行效率。
文本生成視頻 英語
W
QuantStack
3,634
10
Medra4b I1 GGUF
Apache-2.0
Medra4b是基於醫療數據集微調的多語言(英語和羅馬尼亞語)文本生成模型,專注於醫療領域應用。
大型語言模型 Transformers 支持多種語言
M
mradermacher
289
0
Medra4b GGUF
Apache-2.0
Medra4b是一個基於醫療領域的量化語言模型,支持英文和羅馬尼亞文,專注於文本生成和摘要任務。
大型語言模型 Transformers 支持多種語言
M
mradermacher
152
0
Medgemma 4b It Q8 0 GGUF
其他
MedGemma-4B-it-Q8_0-GGUF 是基於 google/medgemma-4b-it 轉換而來的 GGUF 格式模型,專為醫療領域的圖像文本到文本任務設計。
圖像生成文本 Transformers
M
NikolayKozloff
142
2
Latitudegames.muse 12B GGUF
Muse-12B是一個12B參數的文本生成模型,由LatitudeGames開發,旨在提供高質量的文本生成能力。
大型語言模型
L
DevQuasar
291
1
Arxiver Insightsumm T5 Finetuned Model GGUF
Apache-2.0
基於T5架構的靜態量化模型,專注於學術論文摘要生成任務
文本生成 英語
A
mradermacher
131
0
Clinician Note 2.0a GGUF
Clinician-Note-2.0a是一個專注於醫學領域的文本生成模型,特別適用於AI輔助臨床記錄和摘要生成。
大型語言模型 英語
C
mradermacher
644
0
Medra I1 GGUF
Apache-2.0
Medra是基於醫療領域數據集微調的量化語言模型,專注於醫療問答和摘要生成任務。
大型語言模型 支持多種語言
M
mradermacher
369
0
Granite 3.3 8b Instruct Q8 0 GGUF
Apache-2.0
該模型是基於IBM Granite-3.3-8B指令微調模型轉換而來的GGUF格式模型,適用於文本生成任務。
大型語言模型
G
NikolayKozloff
36
2
Deepseek Qwen2.5 14B DeepThinker V2
MIT
DeepThinkerv2是一個具備深度數學推理能力的大語言模型,通過遞歸思考模式和多重驗證機制提升解題準確性。
大型語言模型 英語
D
Vijayendra
113
2
3b Fr Ft Research Release Q4 K M GGUF
Apache-2.0
這是一個基於canopylabs/3b-fr-ft-research_release模型轉換的GGUF格式法語語言模型,適用於文本生成任務。
大型語言模型 法語
3
freddyaboulton
173
1
Gemma 3 27b It Qat Autoawq
Gemma 3是Google推出的輕量級前沿開放模型系列,基於與Gemini相同技術構建,支持多模態輸入(文本/圖像)和文本輸出。27B版本通過量化感知訓練顯著降低內存需求。
圖像生成文本
G
gaunernst
789
4
Gemma 3 12b It Qat Autoawq
Gemma 3是Google基於Gemini技術構建的輕量級開放模型系列,支持多模態輸入和文本輸出。
圖像生成文本
G
gaunernst
498
3
Gemma 3 12b It Q5 K M GGUF
這是由google/gemma-3-12b-it轉換而來的GGUF格式模型,適用於llama.cpp框架。
大型語言模型
G
NikolayKozloff
46
1
Qwen2.5 14B CIC ACLARC GGUF
Apache-2.0
這是一個基於Qwen2.5-14B-Instruct模型進行量化處理的版本,專門用於引文意圖分類任務。
大型語言模型 英語
Q
sknow-lab
42
1
Opencerebrum 1.0 7b SFT GGUF
Apache-2.0
OpenCerebrum-1.0-7b-SFT是一個基於Locutusque/OpenCerebrum-1.0-7b-SFT的靜態量化模型,支持多種量化版本,適用於代碼生成、數學、化學、生物學等領域的文本生成和問答任務。
大型語言模型 支持多種語言
O
mradermacher
162
1
Dermatech Qwen2 VL 2B GGUF
這是一個基於Qwen2架構的多模態模型,支持文本生成、圖像轉文本和視覺問答任務,提供多種量化版本以適應不同需求。
圖像生成文本 英語
D
mradermacher
42
0
Qwen2 VL 72B Instruct GGUF
其他
Qwen2-VL-72B-Instruct-GGUF 是原模型經過量化處理後的版本,支持多模態任務,可通過 GaiaNet 運行。
圖像生成文本 Transformers 英語
Q
gaianet
1,803
0
Qwen2 VL 7B Instruct GGUF
Apache-2.0
Qwen2-VL-7B-Instruct 是一個7B參數規模的多模態模型,支持圖像與文本的交互任務。
圖像生成文本 英語
Q
gaianet
102
2
Qwen2 VL 7B Instruct GGUF
Apache-2.0
Qwen2-VL-7B-Instruct 是一個多模態視覺語言模型,支持圖像和文本的聯合理解與生成任務。
圖像生成文本 英語
Q
second-state
195
4
Meta Llama 3 8B Instruct Q4 K M GGUF
其他
Llama 3 8B 指令模型的 GGUF 量化版本,適用於本地推理,支持高效部署
大型語言模型 英語
M
NoelJacob
1,131
1
Mistral 7B OpenOrca Q4 K M GGUF
Apache-2.0
該模型是基於Open-Orca/Mistral-7B-OpenOrca轉換而來的GGUF格式模型,適用於文本生成任務。
大型語言模型 英語
M
munish0838
81
2
Finance LLM GGUF
其他
Finance LLM 是一個專注於金融領域的語言模型,基於 Llama 架構,經過 OpenOrca、Lima 和 WizardLM 等數據集的微調。
大型語言模型 英語
F
TheBloke
641
21
Tinyllama 1.1B Chat V0.6 GGUF
Apache-2.0
TinyLlama-1.1B-Chat-v0.6 是一個輕量級的聊天模型,基於1.1B參數的Llama架構,專為對話任務優化。
大型語言模型 英語
T
afrideva
128
9
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase