Qwen3 4B GGUF
Apache-2.0
Qwen3-4B是通義千問系列大語言模型的最新版本,具有4B參數規模,支持思維與非思維模式切換,擅長推理、指令遵循和多語言處理。
大型語言模型
Q
QuantFactory
341
1
Llama 3.1 70B Instruct
Meta Llama 3.1 是一組包含80億、700億和4050億參數的預訓練及指令調優生成模型,針對多語言對話場景優化,支持8種語言和代碼生成。
大型語言模型
Transformers 支持多種語言

L
meta-llama
1.2M
806
Dans PersonalityEngine V1.3.0 12b
Apache-2.0
基於50+專業數據集微調的多功能模型,擅長創意任務和技術挑戰,支持10種語言
大型語言模型
Transformers

D
PocketDoc
112
13
Llama 3.1 Nemotron Nano 4B V1.1
其他
Llama-3.1-Nemotron-Nano-4B-v1.1 是一個基於Llama 3.1壓縮優化的大型語言模型,專注於推理和對話任務,支持128K上下文長度,適配單張RTX顯卡。
大型語言模型
Transformers 英語

L
nvidia
5,714
61
Llama 3.1 405B Instruct
Llama 3.1是由Meta開發的多語言大語言模型系列,包含8B、70B和405B三種規模,支持多語言文本生成和代碼生成任務。
大型語言模型
Transformers 支持多種語言

L
meta-llama
34.83k
569
Mistral Small 3.1 24B Instruct 2503 GGUF
Apache-2.0
Mistral-Small-3.1-24B-Instruct-2503 是一個24B參數規模的多語言指令微調模型,支持多種語言和任務,適用於文本生成和對話場景。
大型語言模型 支持多種語言
M
second-state
1,059
1
Meta Llama 3.1 8B Instruct FP16
Llama 3.1是Meta開發的多語言大語言模型集合,包含8B、70B和405B參數版本,支持8種語言,針對對話用例優化。
大型語言模型
Safetensors 支持多種語言
M
context-labs
565.13k
1
Pixtral Large Instruct 2411
其他
Pixtral-Large-Instruct-2411是基於MistralAI技術的多模態指令微調模型,支持圖像和文本輸入,具備多語言處理能力。
圖像生成文本
Transformers 支持多種語言

P
nintwentydo
23
2
Llama 3.3 70B Instruct GGUF
Llama-3.3-70B-Instruct是Meta發佈的多語言大語言模型,針對多語言對話用例進行了優化,在多個行業基準測試中表現優異。
大型語言模型
Transformers 英語

L
unsloth
7,922
65
Llama 3.3 70B Instruct
Meta Llama 3.3是一個700億參數的多語言大語言模型,專為多語言對話場景優化,支持8種語言,在多項基準測試中表現優異。
大型語言模型
Transformers 支持多種語言

L
meta-llama
1.1M
2,282
Nemotron Mini 4B Instruct
其他
Nemotron-Mini-4B-Instruct是英偉達開發的專為角色扮演、檢索增強生成和函數調用優化的響應生成模型,基於Minitron-4B-Base微調,支持4096個token的上下文長度。
大型語言模型
Transformers 英語

N
nvidia
674
162
Glm 4 9b
其他
GLM-4-9B是智譜AI推出的最新開源預訓練模型,在多項基準測試中超越Llama-3-8B,支持128K上下文長度和26種語言。
大型語言模型
Transformers 支持多種語言

G
THUDM
9,944
132
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98