Midm 2.0 Base Instruct Gguf
MIT
Mi:dm 2.0 是採用 KT 專有技術開發的'以韓國為中心的 AI'模型,深度內化了韓國社會獨特的價值觀、認知框架和常識推理。
大型語言模型
Transformers 支持多種語言

M
mykor
517
1
Tencent.hunyuan A13B Instruct GGUF
騰訊混元A13B指令模型的量化版本,通過技術手段在保證性能的同時提升運行效率。
大型語言模型
T
DevQuasar
402
1
Fpham Sydney Overthinker 13b HF GGUF
該項目提供了優化後的GGUF量化文件,可顯著提升模型性能。這些量化文件由Featherless AI提供支持,用戶只需支付少量費用,即可運行任意所需模型。
大型語言模型
F
featherless-ai-quants
133
1
Josiefied DeepSeek R1 0528 Qwen3 8B Abliterated V1 8bit
這是一個基於DeepSeek-R1-0528-Qwen3-8B模型轉換的MLX格式8位量化版本,適用於文本生成任務。
大型語言模型
J
mlx-community
847
1
Deepseek R1 0528 Qwen3 8B 4bit
MIT
該模型是基於DeepSeek-R1-0528-Qwen3-8B轉換的4位量化版本,專為MLX框架優化,適用於文本生成任務。
大型語言模型
D
mlx-community
924
1
Devstral Small 2505 GGUF
Apache-2.0
Devstral-Small-2505的量化版本,提供多種精度選擇以適應不同硬件需求
大型語言模型 支持多種語言
D
Antigma
170
1
Sam Reason S2.1 GGUF
MIT
Sam-reason-S2.1的靜態量化版本,提供多種量化選項以適應不同硬件需求
大型語言模型 英語
S
mradermacher
299
1
INTELLECT 2 GGUF
INTELLECT-2-GGUF 是 PrimeIntellect/INTELLECT-2 的 GGUF 格式量化版本,適用於文本生成任務。
大型語言模型
I
MaziyarPanahi
88
1
Qwen3 4B 4bit DWQ
Apache-2.0
該模型是Qwen3-4B的4位DWQ量化版本,轉換為MLX格式,方便使用mlx庫進行文本生成。
大型語言模型
Q
mlx-community
517
2
Huihui Ai.qwen3 4B Abliterated GGUF
慧慧AI的Qwen3-4B模型的量化版本,旨在讓知識更廣泛地被大眾獲取。
大型語言模型
H
DevQuasar
540
1
Josiefied Qwen3 4B Abliterated V1 6bit
這是一個基於Qwen3-4B模型轉換至MLX格式的6位量化版本,適用於文本生成任務。
大型語言模型
J
mlx-community
15
1
Qwen3 8B 4bit DWQ
Apache-2.0
Qwen3-8B-4bit-DWQ 是基於 Qwen/Qwen3-8B 轉換至 MLX 格式的 4 位量化版本,適用於在 Apple 設備上高效運行。
大型語言模型
Q
mlx-community
306
1
Mlabonne Qwen3 4B Abliterated GGUF
Qwen3-4B-abliterated的量化版本,使用llama.cpp進行量化,支持多種量化類型,適用於文本生成任務。
大型語言模型
M
bartowski
3,623
3
Josiefied Qwen3 1.7B Abliterated V1 4bit
基於Qwen3-1.7B的4位量化版本,適用於MLX框架的輕量級大語言模型
大型語言模型
J
mlx-community
135
2
Qwen3 8B 4bit
Apache-2.0
這是Qwen/Qwen3-8B模型的4位量化版本,已轉換為MLX框架格式,適用於蘋果芯片設備的高效推理。
大型語言模型
Q
mlx-community
2,131
2
Qwen3 4B 4bit
Apache-2.0
Qwen3-4B-4bit 是從 Qwen/Qwen3-4B 轉換至 MLX 格式的 4 位量化版本,適用於在 Apple 芯片上高效運行。
大型語言模型
Q
mlx-community
7,400
6
Internvl2 5 1B MNN
Apache-2.0
基於InternVL2_5-1B的4位量化版本,適用於文本生成和聊天場景
大型語言模型 英語
I
taobao-mnn
2,718
1
Jungzoona T3Q Qwen2.5 14b V1.0 E3 GGUF
Apache-2.0
本倉庫包含JungZoona/T3Q-qwen2.5-14b-v1.0-e3的GGUF格式模型文件,由TensorBlock提供的機器進行量化,兼容llama.cpp。
大型語言模型
Transformers 支持多種語言

J
tensorblock
557
1
Deepcogito Cogito V1 Preview Llama 3B GGUF
基於Llama架構的3B參數語言模型,提供多種量化版本以適應不同硬件需求
大型語言模型
D
tensorblock
162
1
Llama381binstruct Summarize Short Merged
其他
基於Meta-Llama-3.1-8B-Instruct的合併模型,針對法律領域摘要任務進行了微調,能將法律術語轉換為簡短易懂的摘要。
大型語言模型
L
FlamingNeuron
42
0
GLM Z1 9B 0414
MIT
GLM-4-Z1-9B-0414是GLM家族的新一代開源模型,具備優秀的數學推理與通用能力,適合資源受限場景下的輕量部署。
大型語言模型
Transformers 支持多種語言

G
THUDM
3,456
55
Xlm Roberta Base Language Detection Tfjs
MIT
這是一個基於XLM-RoBERTa的多語言檢測模型,支持20種語言的識別。
文本分類 支持多種語言
X
dnouv
14
1
Lightblue Reranker 0.5 Cont Filt 7max Gguf
這是一個文本排序模型,用於對文本進行相關性排序。
文本嵌入
L
RichardErkhov
2,106
0
Traceback 12b
Apache-2.0
TraceBack 12b 是基於 Mistral-Nemo-Instruct 架構的 4bit 量化版本,專注於指令遵循和思維鏈推理任務。
大型語言模型
Transformers

T
secemp9
1,470
29
Chroma GGUF
Apache-2.0
Chroma-GGUF 是一個基於 lodestones/Chroma 的量化模型集合,提供多種不同精度的量化版本,適用於不同的硬件和性能需求。
圖像生成
C
silveroxides
8,529
20
Ozone Ai 0x Lite GGUF
Apache-2.0
基於ozone-ai/0x-lite模型的量化版本,支持中英文文本生成任務,採用llama.cpp進行imatrix量化,提供多種量化選項以適應不同硬件需求。
大型語言模型 支持多種語言
O
bartowski
220
2
Janus Pro 1B 4bit
MIT
基於deepseek-ai/Janus-Pro-1B的4位量化版本,適用於Apple芯片的MLX框架
大型語言模型
J
wnma3mz
40
3
Huihui Ai.deepseek R1 Distill Qwen 32B Abliterated GGUF
這是一個量化版本的大語言模型,旨在讓知識更易於獲取和使用。
大型語言模型
H
DevQuasar
572
3
Meno Tiny 0.1
Apache-2.0
基於Qwen2.5-1.5B-Instruct微調的俄語指令優化模型,15億參數,支持俄英雙語,擅長RAG流程中的文本問答
大型語言模型
Transformers 支持多種語言

M
bond005
764
10
Llama 3.2 3B Instruct GGUF
Llama-3.2-3B-Instruct 模型的 GGUF 格式文件,方便用戶進行文本生成任務。
大型語言模型
L
MaziyarPanahi
203.56k
13
FLUX.1 Schnell GGUF
Apache-2.0
FLUX.1-schnell 是一個高效的文本生成圖像模型,基於擴散模型架構,支持英文文本輸入生成高質量圖像。
文本生成圖像 英語
F
second-state
551
11
FLUX.1 Schnell GGUF
Apache-2.0
FLUX.1-schnell的.gguf量化版本,用於文本到圖像的轉換任務
文本生成圖像
F
OlegSkutte
121
4
Bge M3 GGUF
MIT
該模型是通過ggml.ai的GGUF-my-repo空間,使用llama.cpp從BAAI/bge-m3轉換為GGUF格式的句子相似度模型。
文本嵌入
B
bbvch-ai
266
1
Moralbert Predict Subversion In Lyrics
MIT
這是一個基於PyTorch的文本分類模型,適用於多種文本分類任務。
文本分類
Transformers

M
vjosap
17
1
Mistral Nemo Instruct 2407 GGUF
Mistral-Nemo-Instruct-2407-GGUF 是 mistralai/Mistral-Nemo-Instruct-2407 的 GGUF 格式量化版本,支持多種量化位數(2-bit 至 8-bit),適用於文本生成任務。
大型語言模型
M
MaziyarPanahi
441.17k
44
Omost Dolphin 2.9 Llama3 8b 4bits
Omost發佈的基於Llama3-8B的指令微調模型,採用Dolphin-2.9數據集預訓練,並以4位NF4格式量化。
大型語言模型
Transformers

O
lllyasviel
106
6
Omost Llama 3 8b 4bits
Omost 發佈的 llama-3 模型,具有 8k 上下文長度,採用 nf4 量化。
大型語言模型
Transformers

O
lllyasviel
1,163
21
Openchat 3.6 8b 20240522 IMat GGUF
這是對 openchat/openchat-3.6-8b-20240522 模型進行 Llama.cpp imatrix 量化處理後的版本,提供了不同量化類型的文件,方便用戶根據需求下載和使用。
大型語言模型
O
legraphista
4,416
1
Deepseek V2 Lite IMat GGUF
DeepSeek-V2-Lite 的 GGUF 量化版本,通過 Llama.cpp imatrix 量化處理,減少存儲和計算資源需求,便於部署。
大型語言模型
D
legraphista
491
1
Llama3 Toxic 8B Float16
Apache-2.0
基於unsloth/llama-3-8b-bnb-4bit微調的文本生成模型,使用Unsloth和TRL庫訓練,速度提升2倍
大型語言模型
Transformers 英語

L
theminji
19
4
- 1
- 2
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98