Llama 3 3 Nemotron Super 49B V1 GGUF
其他
Llama-3.3-Nemotron-Super-49B-v1 是一個大型語言模型,基於 Meta Llama-3.3-70B-Instruct 改進,增強了推理能力、人類聊天偏好以及任務執行能力,支持 128K tokens 的上下文長度。
大型語言模型
Transformers 英語

L
unsloth
814
1
Llama 3.1 Nemotron Nano 8B V1 GGUF
其他
Llama-3.1-Nemotron-Nano-8B-v1是基於Meta Llama-3.1-8B-Instruct的推理模型,經過後訓練增強推理能力、人類聊天偏好及任務執行能力。
大型語言模型
Transformers 英語

L
unsloth
22.18k
3
Llama 3 1 Nemotron Ultra 253B CPT V1
其他
Llama-3.1-Nemotron-Ultra-253B-CPT-v1是基於Meta Llama-3.1-405B-Instruct的大型語言模型,支持128K tokens上下文長度,經過神經架構搜索優化,在準確性和效率之間取得良好平衡。
大型語言模型
Transformers 英語

L
nvidia
155
3
Llama 3 3 Nemotron Super 49B V1
其他
Llama-3.3-Nemotron-Super-49B-v1是基於Meta Llama-3.3-70B-Instruct的大型語言模型,專注於推理、對話偏好和任務執行,支持128K tokens上下文長度。
大型語言模型
Transformers 英語

L
nvidia
150.65k
270
Deepseek R1
MIT
DeepSeek-R1是深度求索推出的第一代推理模型,通過大規模強化學習訓練,在數學、代碼和推理任務上表現優異。
大型語言模型
Transformers

D
deepseek-ai
1.7M
12.03k
Glm 4 9b Hf
其他
GLM-4-9B是智譜AI推出的GLM-4系列最新一代預訓練模型的開源版本,在語義、數學、推理、代碼和知識等數據集評估中表現出色,具備多語言支持等先進特性。
大型語言模型
Safetensors 支持多種語言
G
THUDM
1,799
7
Glm 4 9b Chat Hf
其他
GLM-4-9B是智譜AI推出的GLM-4系列最新一代預訓練模型的開源版本,具備卓越的語義、數學、推理、代碼和知識能力。
大型語言模型
Transformers 支持多種語言

G
THUDM
7,919
13
Phi 3.5 Mini Instruct
MIT
Phi-3.5-mini 是一個輕量級、最先進的開源模型,基於 Phi-3 使用的數據集構建,支持 128K 的上下文長度,特別注重高質量、富含推理能力的數據。
大型語言模型
Transformers 其他

P
microsoft
354.64k
859
Glm 4 9b
其他
GLM-4-9B是智譜AI推出的最新開源預訓練模型,在多項基準測試中超越Llama-3-8B,支持128K上下文長度和26種語言。
大型語言模型
Transformers 支持多種語言

G
THUDM
9,944
132
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98