# 128K長文本

Llama 3.1 Nemotron Nano 4B V1.1
其他
Llama-3.1-Nemotron-Nano-4B-v1.1 是一個基於Llama 3.1 8B壓縮而來的大型語言模型,優化了推理能力和任務執行效率,適用於單塊RTX顯卡本地運行。
大型語言模型 Transformers 英語
L
unsloth
219
4
Typhoon2.1 Gemma3 4b
泰語大語言模型(指令調優版),擁有40億參數、128K上下文長度且具備函數調用能力
大型語言模型
T
scb10x
2,083
3
Typhoon2.1 Gemma3 12b
Typhoon2.1-Gemma3-12B 是一個基於Gemma3架構的120億參數泰語大語言模型,支持128K上下文長度和函數調用功能。
大型語言模型 Safetensors
T
scb10x
159.13k
2
Phi 4 Mini Reasoning
MIT
Phi-4-mini-reasoning是一個輕量級的開源模型,專注於高質量、密集推理的數據,並進一步微調以獲得更高級的數學推理能力。
大型語言模型 Transformers 支持多種語言
P
microsoft
18.93k
152
R01 Gemma 3 1b It
Gemma 3是谷歌推出的輕量級開源多模態模型,基於與Gemini相同技術構建,支持文本和圖像輸入並生成文本輸出。
文本生成圖像 Transformers 英語
R
EpistemeAI
17
1
Phi 4 Mini Instruct Abliterated
MIT
Phi-4-mini-instruct是基於合成數據和精選公開網站構建的輕量級開源模型,專注於高質量、強推理能力的數據。支持128K令牌上下文長度,通過監督微調和直接偏好優化進行增強,以確保精準的指令遵循和安全性。
大型語言模型 Transformers 支持多種語言
P
lunahr
250
8
Phi 4 Mini Instruct
MIT
Phi-4-mini-instruct是一個輕量級開源模型,基於合成數據和過濾後的公開網站數據構建,專注於高質量、富含推理能力的數據。支持128K令牌的上下文長度和多語言處理。
大型語言模型 Transformers 支持多種語言
P
microsoft
346.30k
455
Chocolatine 2 14B Instruct V2.0.3
Apache-2.0
Chocolatine-2-14B-Instruct-v2.0.3 是一個基於 Qwen-2.5-14B 架構的大語言模型,經過 DPO 微調,專注於法語和英語任務,在法語 LLM 排行榜中表現優異。
大型語言模型 Transformers 支持多種語言
C
jpacifico
329
14
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase