Denker-mistral-nemo-12B開源推理模型 - 小型無審查精準推理超實用

Denker Mistral Nemo 12B

由nbeerbower開發

Denker是一個小型、無審查、專注於推理的模型，基於mistral-nemo-kartoffel-12B使用ORPO和QLoRA進行微調。

下載量 20

發布時間 : 5/12/2025

模型概述

這是一個實驗性模型，專注於推理和思維鏈能力，採用無審查設計，適用於需要邏輯推理和問題解決的任務。

無審查設計

模型設計為無審查，適合需要自由表達和探索性思考的場景

推理優化

專注於邏輯推理和問題解決能力，特別強化了思維鏈表現

ORPO微調

使用ORPO(Odds Ratio Preference Optimization)方法進行微調

QLoRA高效訓練

採用QLoRA技術進行參數高效微調

文本生成

邏輯推理

數學問題解答

代碼推理

物理推理

思維鏈推理

教育與研究

數學問題解答

解決複雜的數學推理問題

物理推理

理解和解決物理相關的問題

編程輔助

代碼推理

幫助理解和生成代碼

一般推理

邏輯問題解答

解決需要複雜邏輯推理的問題

屬性	詳情
庫名稱	transformers
許可證	apache-2.0
基礎模型	nbeerbower/mistral-nemo-kartoffel-12B
數據集	nbeerbower/Schule-DPO、nbeerbower/Purpura-DPO、nbeerbower/Arkhaios-DPO、jondurbin/truthy-dpo-v0.1、antiven0m/physical-reasoning-dpo、Atsunori/HelpSteer2-DPO、GeneralReasoning/GeneralThought-430K、nvidia/OpenMathReasoning、nvidia/OpenCodeReasoning
標籤	orpo、uncensored、reasoning、chain-of-thought、qlora、experimental