M

Marco O1

由AIDC-AI開發
Marco-o1是一個專注於開放式解決方案的開放推理模型,通過思維鏈微調、蒙特卡洛樹搜索和反思機制增強複雜問題解決能力。
下載量 5,007
發布時間 : 11/13/2024

模型概述

Marco-o1大語言模型通過思維鏈微調、蒙特卡洛樹搜索(MCTS)、反思機制和創新推理策略優化,專為複雜現實問題求解任務設計,特別關注缺乏明確標準答案的開放式問題。

模型特點

思維鏈微調
基於開源CoT數據集與自研合成數據全參數微調,構建Marco-o1-CoT模型
MCTS擴展解空間
融合LLM與蒙特卡洛樹搜索(Marco-o1-MCTS),利用模型置信度指導搜索
推理動作策略
實現推理動作策略與反思機制,包括MCTS框架內多粒度動作探索與模型自反思
多語言應用
首次將大推理模型應用於機器翻譯任務,探索多語言領域的推理縮放規律

模型能力

複雜問題推理
數學解題
編程問題解決
多語言翻譯
開放式問題解答

使用案例

教育
數學問題求解
解決需要多步推理的數學問題
在MGSM數據集上準確率提升6.17%
編程
算法問題解決
解決需要創造性思維的編程挑戰
翻譯
俚語翻譯
精準翻譯口語化表達
如將'踩屎感'譯為'comfortable sole'
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase