F

Fairyr1 32B

由PKU-DS-LAB開發
FairyR1-32B是一款高效的大型語言模型,基於DeepSeek-R1-Distill-Qwen-32B,通過優化的蒸餾與合併流程,在數學和編程任務上表現優異。
下載量 372
發布時間 : 5/23/2025

模型概述

FairyR1-32B是一款專注於數學和編程任務的高效語言模型,通過任務導向的微調和模型合併技術,顯著降低了模型規模和推理成本,同時保持高性能。

模型特點

高效性能
僅使用約5%的參數,在數學和編程任務上表現與更大規模模型相當或更優。
優化的蒸餾流程
通過多階段數據篩選和重構,精選高質量訓練樣本,提升模型性能。
模型合併技術
使用AcreeFusion工具將多個專家模型融合為統一模型,簡化架構並降低成本。

模型能力

數學問題解答
代碼生成
科學問答
文本生成

使用案例

教育
數學競賽題解答
用於解答AIME等數學競賽題目,提供詳細解題步驟。
在AIME 2024和2025測試中表現優異。
編程
代碼生成與優化
生成和優化編程代碼,支持多種編程語言。
在LiveCodeBench測試中表現優於同類模型。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase