S

Skywork O1 Open Llama 3.1 8B

由Skywork開發
Skywork o1 Open-Llama-3.1-8B是基於Llama-3.1-8B訓練的強力對話模型,通過'慢思考'推理風格數據顯著增強推理能力。
下載量 583
發布時間 : 11/26/2024

模型概述

具備類o1慢思考推理能力的先進模型,專長解決數學、編程和邏輯推理等複雜問題。

模型特點

慢思考推理能力
通過專有訓練方法實現深度思考、規劃和反思能力
三階段訓練方案
包含反思式推理訓練、推理能力強化學習和推理規劃
Q*在線推理算法
首次實現並公開發布的先進推理算法,優化推理路徑

模型能力

複雜問題求解
數學推理
邏輯推理
編程問題解答
倫理決策分析
自我驗證

使用案例

教育
數學問題解答
解決各類數學應用題和方程式
在GSM8K等數學測試集上表現優異
編程
算法問題解決
分析並解決編程算法問題
在HumanEval等編程測試中表現突出
邏輯分析
邏輯推理題
解答各類邏輯關係和類比推理問題
展示出優秀的邏輯分析能力
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase