F

Fathom R1 14B

由FractalAIResearch開發
以499美元訓練成本實現的14B參數數學推理模型,在16K上下文窗口下達到媲美閉源o4-mini的性能
下載量 2,112
發布時間 : 5/13/2025

模型概述

基於Deepseek-R1-Distilled-Qwen-14B的140億參數推理模型,通過創新訓練方法在16K上下文限制內實現SOTA數學推理能力

模型特點

低成本高效訓練
僅花費499美元訓練成本即實現媲美閉源o4-mini的性能
16K上下文限制
在嚴格16K上下文窗口下實現最優性能,避免過長推理鏈的可靠性問題
迭代課程學習
採用多輪課程學習策略漸進提升模型在不同難度數學題上的表現
推理鏈壓縮
通過RL訓練使模型生成更簡潔有效的推理步驟

模型能力

高級數學推理
奧數競賽題求解
複雜問題分步解答
跨領域知識應用

使用案例

教育
奧數競賽輔導
用於AIME/HMMT等數學競賽的題目解答與輔導
AIME2025達到52.71% Pass@1準確率
數學教育輔助
幫助學生理解複雜數學概念的分步推理過程
研究
推理模型研究
作為低成本高效推理模型的基準研究對象
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase