Deepseek R1 Llama 8B F32 GGUF
Apache-2.0
DeepSeek-R1-Llama-8B-F32-GGUF 是 DeepSeek-R1-Distill-Llama-8B 的量化版本,採用強化學習直接訓練,具備自我驗證、反思和生成擴展思維鏈等能力。
大型語言模型
Transformers 英語

D
prithivMLmods
326
1
Deepseek Qwen Bllossom 32B
MIT
DeepSeek-qwen-Bllossom-32B是基於DeepSeek-R1-Distill-Qwen-32B模型構建的,旨在提升韓語環境下的推理性能。
大型語言模型
Transformers 支持多種語言

D
UNIVA-Bllossom
167
3
Reasonflux F1 7B
其他
ReasonFlux-F1-7B是基於思維模板擴展的分層大語言模型推理模型,通過模板增強推理軌跡微調而成,在多項推理任務中表現優異。
大型語言模型
Transformers

R
Gen-Verse
291
2
Openvlthinker 7B
Apache-2.0
OpenVLThinker-7B 是一個專為處理多模態任務設計的視覺語言推理模型,特別針對視覺數學問題解決進行了優化。
圖像生成文本
Transformers

O
ydeng9
594
16
Loqwqtus2.5 32B Instruct
Apache-2.0
基於Qwen系列模型的標準化去噪傅里葉插值混合模型,以高質量回答和情感共鳴著稱的思考型大語言模型
大型語言模型
Transformers 英語

L
maldv
77
2
Deductive Reasoning Qwen 32B
MIT
基於Qwen 2.5 32B Instruct通過強化微調訓練的模型,專門用於解決Temporal Clue數據集中具有挑戰性的演繹推理問題。
大型語言模型
Transformers 英語

D
OpenPipe
1,669
39
Mistral Small 24B Instruct 2501 Reasoning
Apache-2.0
基於Mistral-Small-24B-Instruct-2501微調的數學推理模型,優化了數學推理能力
大型語言模型 英語
M
yentinglin
1,689
54
Skywork O1 Open PRM Qwen 2.5 7B
其他
Skywork o1開放模型系列中的7B參數規模模型,基於Qwen2.5-Math-7B-Instruct訓練,具備漸進式過程獎勵增強的推理能力
大型語言模型
S
Skywork
3,608
50
Tulu3
其他
Tülu3是由艾倫人工智能研究所開發的新一代指令跟隨模型家族,擅長標準聊天應用和複雜問題解決。
大型語言模型
T
cortexso
226
1
Marco O1
Apache-2.0
Marco-o1是一個專注於開放式解決方案的開放推理模型,通過思維鏈微調、蒙特卡洛樹搜索和反思機制增強複雜問題解決能力。
大型語言模型
Transformers

M
AIDC-AI
5,007
715
Einstein V6.1 Llama3 8B
其他
基於Meta-Llama-3-8B在多樣化科學數據集上微調的大語言模型,專注於STEM領域任務
大型語言模型
Transformers 英語

E
Weyaxi
70
67
UNA SimpleSmaug 34b V1beta
Apache-2.0
基於Smaug-34B的監督微調模型,專注於提升數學和推理能力,在34B規模模型中表現優異。
大型語言模型
Transformers

U
fblgit
18
21
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98