Qwen3 30B A6B 16 Extreme GGUF
基於Qwen/Qwen3-30B-A3B-Base生成的超低比特量化模型,支持32k上下文長度,適用於多種硬件環境
大型語言模型
Transformers

Q
Mungert
1,321
1
Nvidia Llama 3.1 Nemotron Nano 4B V1.1 GGUF
其他
基於NVIDIA Llama-3.1-Nemotron-Nano-4B-v1.1模型的量化版本,使用llama.cpp工具進行多種量化處理,適合在資源受限的環境中運行。
大型語言模型 英語
N
bartowski
2,553
8
Goekdeniz Guelmez Josiefied Qwen3 8B Abliterated V1 GGUF
這是Qwen3-8B模型的量化版本,使用llama.cpp進行imatrix量化,適用於聊天場景。
大型語言模型
G
bartowski
7,520
12
Mlabonne Qwen3 4B Abliterated GGUF
Qwen3-4B-abliterated的量化版本,使用llama.cpp進行量化,支持多種量化類型,適用於文本生成任務。
大型語言模型
M
bartowski
3,623
3
Fin R1 GGUF
Apache-2.0
Fin-R1是一款針對金融領域複雜推理的大型語言模型,基於Qwen2.5-7B-Instruct微調,在金融基準測試中表現優異。
大型語言模型
F
Mungert
4,285
7
Doclayout YOLO D4LA From Scratch
DocLayout-YOLO 是一個基於 YOLO 架構的文檔佈局檢測模型,用於識別和分析文檔中的各種元素和結構。
目標檢測
D
nielsr
27
0
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98