# 複雜問題求解

Deepseek R1 Llama 8B F32 GGUF
Apache-2.0
DeepSeek-R1-Llama-8B-F32-GGUF 是 DeepSeek-R1-Distill-Llama-8B 的量化版本,採用強化學習直接訓練,具備自我驗證、反思和生成擴展思維鏈等能力。
大型語言模型 Transformers 英語
D
prithivMLmods
326
1
Deepseek Qwen Bllossom 32B
MIT
DeepSeek-qwen-Bllossom-32B是基於DeepSeek-R1-Distill-Qwen-32B模型構建的,旨在提升韓語環境下的推理性能。
大型語言模型 Transformers 支持多種語言
D
UNIVA-Bllossom
167
3
Reasonflux F1 7B
其他
ReasonFlux-F1-7B是基於思維模板擴展的分層大語言模型推理模型,通過模板增強推理軌跡微調而成,在多項推理任務中表現優異。
大型語言模型 Transformers
R
Gen-Verse
291
2
Openvlthinker 7B
Apache-2.0
OpenVLThinker-7B 是一個專為處理多模態任務設計的視覺語言推理模型,特別針對視覺數學問題解決進行了優化。
圖像生成文本 Transformers
O
ydeng9
594
16
Loqwqtus2.5 32B Instruct
Apache-2.0
基於Qwen系列模型的標準化去噪傅里葉插值混合模型,以高質量回答和情感共鳴著稱的思考型大語言模型
大型語言模型 Transformers 英語
L
maldv
77
2
Deductive Reasoning Qwen 32B
MIT
基於Qwen 2.5 32B Instruct通過強化微調訓練的模型,專門用於解決Temporal Clue數據集中具有挑戰性的演繹推理問題。
大型語言模型 Transformers 英語
D
OpenPipe
1,669
39
Mistral Small 24B Instruct 2501 Reasoning
Apache-2.0
基於Mistral-Small-24B-Instruct-2501微調的數學推理模型,優化了數學推理能力
大型語言模型 英語
M
yentinglin
1,689
54
Skywork O1 Open PRM Qwen 2.5 7B
其他
Skywork o1開放模型系列中的7B參數規模模型,基於Qwen2.5-Math-7B-Instruct訓練,具備漸進式過程獎勵增強的推理能力
大型語言模型
S
Skywork
3,608
50
Tulu3
其他
Tülu3是由艾倫人工智能研究所開發的新一代指令跟隨模型家族,擅長標準聊天應用和複雜問題解決。
大型語言模型
T
cortexso
226
1
Marco O1
Apache-2.0
Marco-o1是一個專注於開放式解決方案的開放推理模型,通過思維鏈微調、蒙特卡洛樹搜索和反思機制增強複雜問題解決能力。
大型語言模型 Transformers
M
AIDC-AI
5,007
715
Einstein V6.1 Llama3 8B
其他
基於Meta-Llama-3-8B在多樣化科學數據集上微調的大語言模型,專注於STEM領域任務
大型語言模型 Transformers 英語
E
Weyaxi
70
67
UNA SimpleSmaug 34b V1beta
Apache-2.0
基於Smaug-34B的監督微調模型,專注於提升數學和推理能力,在34B規模模型中表現優異。
大型語言模型 Transformers
U
fblgit
18
21
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase