Granite 3.3 8b Instruct GGUF
Apache-2.0
Granite-3.3-8B-Instruct 是一款具有80億參數、支持128K上下文長度的語言模型,專為提升推理和指令跟隨能力而微調。
大型語言模型
G
unsloth
7,102
2
Qwen3 235B A22B FP8 Dynamic
Apache-2.0
Qwen3-235B-A22B模型的FP8量化版本,有效降低GPU內存需求,提高計算吞吐量,適用於多種自然語言處理場景。
大型語言模型
Transformers

Q
RedHatAI
2,198
2
Qwen3 14B FP8 Dynamic
Apache-2.0
Qwen3-14B-FP8-dynamic 是一個經過優化的大語言模型,通過將激活值和權重量化為 FP8 數據類型,有效降低了 GPU 內存需求,提高了計算吞吐量。
大型語言模型
Transformers

Q
RedHatAI
167
1
Qwen3 8B GGUF
Apache-2.0
Qwen3是通義千問系列最新一代大語言模型,提供完整的稠密模型與混合專家(MoE)模型套件。基於大規模訓練,Qwen3在推理、指令跟隨、智能體能力和多語言支持方面實現突破性進展。
大型語言模型
Transformers

Q
Mungert
1,931
7
Qwen3 0.6B FP8
Apache-2.0
Qwen3-0.6B-FP8是通義千問系列大語言模型的最新版本,提供0.6B參數的FP8量化版本,支持思維模式自由切換和多種語言任務。
大型語言模型
Transformers

Q
Qwen
5,576
43
Mistral Small 3.1 24B Instruct 2503 MAX NEO Imatrix GGUF
Apache-2.0
Mistralai推出的24B參數指令微調模型,支持128k上下文長度和多語言處理,採用Neo Imatrix技術和MAX量化方案提升性能
大型語言模型 支持多種語言
M
DavidAU
38.29k
31
Granite 3.2 8b Instruct GGUF
Apache-2.0
Granite-3.2-8B-Instruct是一個80億參數的長上下文AI模型,專為思維推理能力微調,支持多種語言和任務。
大型語言模型
Transformers

G
ibm-research
1,059
5
Granite 3.2 2b Instruct GGUF
Apache-2.0
Granite-3.2-2B-Instruct是一個20億參數的長上下文AI模型,專為思維推理能力微調,支持12種語言和多任務處理。
大型語言模型
G
ibm-research
1,476
7
Falcon3
Apache-2.0
Falcon3-10B-Instruct是Falcon3系列的開源基礎模型,擁有100億參數,專注於高質量指令跟隨任務,支持多語言處理,上下文長度可達32K tokens。
大型語言模型
F
cortexso
244
1
Llama 3.2 1B Instruct Q4 K M GGUF
這是一個基於Meta Llama-3.2-1B-Instruct模型轉換的GGUF格式量化版本,適用於本地推理場景。
大型語言模型 支持多種語言
L
hugging-quants
24.70k
16
Phi 3 Medium 4k Instruct Abliterated V3 GGUF
MIT
這是microsoft/Phi-3-medium-4k-instruct的正交化版本,通過特定技術抑制了模型的拒絕傾向,儘可能保留了原始模型的知識和能力。
大型語言模型 其他
P
failspy
85
26
Phi 3 Medium 4k Instruct
MIT
Phi-3-Medium-4K-Instruct是一個140億參數的輕量級開源模型,專注於高質量推理能力,支持4K上下文長度,適用於英語環境下的商業和研究用途。
大型語言模型
Transformers 其他

P
microsoft
43.60k
219
Mixtral 8x22B Instruct V0.1 GGUF
Apache-2.0
基於mistralai/Mixtral-8x22B-Instruct-v0.1模型的GGUF量化版本,支持多語言文本生成任務
大型語言模型 支持多種語言
M
MaziyarPanahi
1,333
33
Mixtral 8x7B Instruct V0.1 HF
Apache-2.0
Mixtral-8x7B是一個預訓練的生成式稀疏混合專家大語言模型,在多數基準測試中表現優於Llama 2 70B。
大型語言模型
Transformers 支持多種語言

M
LoneStriker
45
4
Swallow 7b Instruct Hf
基於Llama 2系列優化的日語增強型大語言模型,通過監督式微調提升指令跟隨能力
大型語言模型
Transformers 支持多種語言

S
tokyotech-llm
1,938
42
Tamil Llama 7b Instruct V0.1
這是一個基於LLaMA-2增強的70億參數泰米爾語大語言模型,支持泰米爾語和英語的文本生成任務。
大型語言模型
Transformers 支持多種語言

T
abhinand
2,461
8
42dot LLM SFT 1.3B
42dot開發的13億參數指令跟隨型大語言模型,基於LLaMA 2架構的監督微調版本
大型語言模型
Transformers 支持多種語言

4
42dot
676
37
Guanaco 7b Leh V2
Gpl-3.0
基於LLaMA 7B的多語言指令跟隨語言模型,支持英文、中文和日語,適用於聊天機器人和指令跟隨任務。
大型語言模型
Transformers 支持多種語言

G
KBlueLeaf
474
37
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98