M

Mistral Nemo 12B R1 V0.2

由CreitinGameplays開發
基於Mistral-Nemo-Instruct-2407微調的大語言模型,專注於系統性邏輯推理和分步解答能力。
下載量 197
發布時間 : 4/18/2025

模型概述

該模型在1臺Nvidia H100上進行了12小時的微調,擅長處理需要分步推理的任務,如數學問題解答和邏輯分析。

模型特點

系統性推理能力
採用<think>標籤格式進行結構化思考,提供至少6個邏輯步驟的詳細推理過程
高效微調
僅需12小時H100訓練即可獲得優質推理能力
數學邏輯處理
擅長數值比較、計數等需要逐步驗證的任務

模型能力

分步邏輯推理
數學問題解答
文本生成
結構化思考

使用案例

教育輔助
數學問題解答
解決需要分步驗證的數學比較問題
如示例中準確比較9.9和9.11的大小
邏輯測試
字母計數
執行精確的字母位置分析和計數
如示例中正確識別'strawberry'包含3個R
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase