# GGUF高效推理

Qwen2.5 VL 7B Meteorology I1 GGUF
其他
Qwen2.5-VL-7B-Meteorology的量化版本,適用於氣象、氣候等領域的圖像文本處理任務,能在不同硬件條件下高效運行。
圖像生成文本 Transformers 英語
Q
mradermacher
124
1
ERNIE 4.5 0.3B PT GGUF
Apache-2.0
該模型是百度ERNIE-4.5-0.3B-PT的GGUF格式轉換版本,支持中英文文本生成任務。
大型語言模型 支持多種語言
E
wqerrewetw
173
1
Wan2.1 14B VACE GGUF
Apache-2.0
Wan2.1-VACE-14B模型的GGUF格式版本,主要用於文本到視頻的生成任務。
文本生成視頻
W
QuantStack
146.36k
139
Gemma 2 9b It Russian Function Calling GGUF
Apache-2.0
該模型是基於google/gemma-2-9b-it針對函數調用任務進行微調的版本,訓練數據完全由人工標註,使用了俄語版本的DiTy/function-calling數據集。
大型語言模型 其他
G
DiTy
509
23
3b De Ft Research Release Q4 K M GGUF
Apache-2.0
這是一個基於canopylabs/3b-de-ft-research_release模型轉換而來的GGUF格式模型,專門優化用於德語文本處理。
大型語言模型 德語
3
TheVisitorX
16
0
3b Zh Ft Research Release Q4 K M GGUF
Apache-2.0
這是一個基於canopylabs/3b-zh-ft-research_release轉換至GGUF格式的中文語言模型,適用於文本生成任務。
大型語言模型 中文
3
freddyaboulton
142
1
3b De Ft Research Release Q4 K M GGUF
Apache-2.0
這是一個基於canopylabs/3b-de-ft-research_release模型轉換的GGUF格式德語語言模型,適用於文本生成任務。
大型語言模型 德語
3
freddyaboulton
200
0
Slim Orpheus 3b JAPANESE Ft Q4 K M GGUF
Apache-2.0
這是一個基於slim-orpheus-3b-JAPANESE-ft模型轉換的GGUF格式模型,專門針對日語文本處理進行了優化。
大型語言模型 日語
S
Gapeleon
40
0
3b Es It Ft Research Release Q4 K M GGUF
Apache-2.0
這是一個基於canopylabs/3b-es_it-ft-research_release轉換的GGUF格式模型,支持西班牙語和意大利語。
大型語言模型 支持多種語言
3
freddyaboulton
1,052
0
Llama 3 3 Nemotron Super 49B V1 Q6 K GGUF
其他
該模型是基於NVIDIA的Llama-3_3-Nemotron-Super-49B-v1轉換而來的GGUF格式版本,適用於文本生成任務。
大型語言模型 英語
L
openfree
2,495
5
Qwen2.5 VL 72B Instruct GGUF
其他
Qwen2.5-VL-72B-Instruct是一個72B參數規模的多模態大模型,支持視覺-語言任務,能夠理解和生成與圖像相關的文本內容。
文本生成圖像 英語
Q
Mungert
2,798
5
Qwen2.5 VL 32B Instruct GGUF
Apache-2.0
Qwen2.5-VL-32B-Instruct 是一個32B參數規模的多模態視覺語言模型,支持圖像和文本的聯合理解與生成任務。
圖像生成文本 英語
Q
Mungert
9,766
6
Bge Reranker V2 M3 Q4 K M GGUF
Apache-2.0
本模型是基於BAAI/bge-reranker-v2-m3轉換的GGUF格式模型,用於文本排序任務,支持多語言。
文本嵌入 其他
B
sabafallah
49
0
Llama 3.1 Nemotron Nano 8B V1 GGUF
其他
NVIDIA發佈的8B參數規模的開源大語言模型,基於Llama-3架構,提供多種量化版本
大型語言模型 英語
L
tensorblock
1,048
4
Gemma 3 12b It Q6 K GGUF
這是Google Gemma 3B模型的GGUF量化版本,適用於本地部署和推理。
大型語言模型
G
NikolayKozloff
16
1
T5 Small Q4 K M GGUF
Apache-2.0
該模型是通過ggml.ai的GGUF-my-repo空間,使用llama.cpp從google-t5/t5-small轉換至GGUF格式的量化版本。
機器翻譯 支持多種語言
T
egrhfnfdg
25
0
Mistral 7B Business F16 GGUF
Apache-2.0
這是一個基於Mistral-7B的商業領域適配模型,轉換為GGUF格式以便在llama.cpp中使用。
大型語言模型 英語
M
rafaelldietrich
31
1
Teuken 7B Instruct Research V0.4 Q6 K GGUF
其他
該模型是基於openGPT-X/Teuken-7B-instruct-research-v0.4轉換的GGUF格式版本,支持多語言文本生成任務。
大型語言模型 支持多種語言
T
lukasfast
36
2
Noticia 7B GGUF
Apache-2.0
NoticIA-7B是一個基於西班牙語的新聞摘要生成模型,專注於處理新聞內容並生成摘要。
大型語言模型 西班牙語
N
mradermacher
105
1
Mental Health FineTuned Mistral 7B Instruct V0.2 I1 GGUF
Apache-2.0
這是一個基於Mistral-7B-Instruct-v0.2模型微調的心理健康諮詢對話模型,提供了多種量化版本以適應不同需求。
大型語言模型 英語
M
mradermacher
501
3
Bge Reranker Large Q4 K M GGUF
MIT
該模型是基於BAAI/bge-reranker-large轉換而來的GGUF格式模型,用於重排序任務,支持中英文。
文本嵌入 支持多種語言
B
DrRos
164
1
T5 Small Q8 0 GGUF
Apache-2.0
該模型是通過ggml.ai的GGUF-my-repo空間,使用llama.cpp從google-t5/t5-small轉換為GGUF格式的量化版本。
機器翻譯 支持多種語言
T
agkavin
27
1
Summllama3 8B Q3 K M GGUF
該模型是基於DISLab/SummLlama3-8B轉換的GGUF格式模型,適用於文本摘要任務。
文本生成
S
dil99x
32
0
Bge Reranker V2 M3 Q4 K M GGUF
Apache-2.0
該模型是從BAAI/bge-reranker-v2-m3轉換而來的GGUF格式模型,用於文本重排序任務,支持多語言。
文本嵌入 其他
B
puppyM
83
1
C4ai Command R 08 2024
這是一個基於CoForAI/c4ai-command-r-08-2024模型轉換的GGUF格式文本生成模型,支持多種語言。
大型語言模型 支持多種語言
C
KimChen
22
2
Gguf Sharded LaMini Flan T5 248M
這是一個基於MBZUAI/LaMini-Flan-T5-248M模型轉換的GGUF格式模型,適用於文本生成任務。
大型語言模型 英語
G
Felladrin
30
1
Llava Llama 3 8b V1 1 Q3 K S GGUF
該模型是基於xtuner/llava-llama-3-8b-v1_1轉換的GGUF格式模型,支持圖像和文本的多模態處理。
圖像生成文本
L
djward888
17
1
Meta Llama 3 8B Instruct GGUF
其他
Meta-Llama-3-8B-Instruct的GGUF量化版本,適用於本地部署和推理
大型語言模型 英語
M
LiteLLMs
76
2
Wizardlm 2 8x22B GGUF
Apache-2.0
WizardLM-2-8x22B-GGUF是微軟WizardLM-2-8x22B模型的GGUF格式量化版本,支持多種比特量化,適用於文本生成任務。
大型語言模型
W
MaziyarPanahi
9,720
127
Taiwan LLM 13B V2.0 Chat GGUF
Apache-2.0
基於LLaMa2-13b的臺灣大語言模型,支持繁體中文,採用GGUF格式
大型語言模型 中文
T
audreyt
80
8
Tinyllama V0 GGUF
MIT
TinyLLama-v0 是一個輕量級語言模型,基於 GGUF 格式提供,適用於文本生成任務。
大型語言模型 英語
T
aladar
72
2
Pygmalion 2 13B SuperCOT Weighed GGUF
這是Pygmalion-2-13b與SuperCOT的加權融合實驗模型,支持指令格式交互,適用於文本生成任務。
大型語言模型 英語
P
TheBloke
1,468
9
Codellama 7B Python GGUF
CodeLlama 7B Python是Meta開發的專注於Python代碼生成的7B參數大語言模型,提供GGUF格式量化版本
大型語言模型 Transformers
C
TheBloke
2,385
57
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase