Llama 3.1 Nemotron Nano 4B V1.1
其他
Llama-3.1-Nemotron-Nano-4B-v1.1 是一個基於Llama 3.1 8B壓縮而來的大型語言模型,優化了推理能力和任務執行效率,適用於單塊RTX顯卡本地運行。
大型語言模型
Transformers 英語

L
unsloth
219
4
Typhoon2.1 Gemma3 4b
泰語大語言模型(指令調優版),擁有40億參數、128K上下文長度且具備函數調用能力
大型語言模型
T
scb10x
2,083
3
Typhoon2.1 Gemma3 12b
Typhoon2.1-Gemma3-12B 是一個基於Gemma3架構的120億參數泰語大語言模型,支持128K上下文長度和函數調用功能。
大型語言模型
Safetensors
T
scb10x
159.13k
2
Phi 4 Mini Reasoning
MIT
Phi-4-mini-reasoning是一個輕量級的開源模型,專注於高質量、密集推理的數據,並進一步微調以獲得更高級的數學推理能力。
大型語言模型
Transformers 支持多種語言

P
microsoft
18.93k
152
R01 Gemma 3 1b It
Gemma 3是谷歌推出的輕量級開源多模態模型,基於與Gemini相同技術構建,支持文本和圖像輸入並生成文本輸出。
文本生成圖像
Transformers 英語

R
EpistemeAI
17
1
Phi 4 Mini Instruct Abliterated
MIT
Phi-4-mini-instruct是基於合成數據和精選公開網站構建的輕量級開源模型,專注於高質量、強推理能力的數據。支持128K令牌上下文長度,通過監督微調和直接偏好優化進行增強,以確保精準的指令遵循和安全性。
大型語言模型
Transformers 支持多種語言

P
lunahr
250
8
Phi 4 Mini Instruct
MIT
Phi-4-mini-instruct是一個輕量級開源模型,基於合成數據和過濾後的公開網站數據構建,專注於高質量、富含推理能力的數據。支持128K令牌的上下文長度和多語言處理。
大型語言模型
Transformers 支持多種語言

P
microsoft
346.30k
455
Chocolatine 2 14B Instruct V2.0.3
Apache-2.0
Chocolatine-2-14B-Instruct-v2.0.3 是一個基於 Qwen-2.5-14B 架構的大語言模型,經過 DPO 微調,專注於法語和英語任務,在法語 LLM 排行榜中表現優異。
大型語言模型
Transformers 支持多種語言

C
jpacifico
329
14
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98