Y

Yixin Distill Qwen 72B 4.5bpw H6 Exl2

由LoneStriker開發
基於Qwen2.5-72B通過強化學習蒸餾的高性能數學推理與通用知識處理模型,在數學推理和通用知識任務中表現優異。
下載量 37
發布時間 : 3/15/2025

模型概述

針對數學推理和通用知識任務專項優化的高性能大語言模型,採用前沿蒸餾技術提升推理能力的同時保持計算效率。

模型特點

數學推理專項優化
針對數學推理任務進行專項優化,在各類數學基準測試中表現優異
高效蒸餾技術
採用漸進式兩階段蒸餾法,通過智能數據選擇與優化迭代提升模型性能
多語言支持
支持中英雙語處理,特別優化中文語境下的表現
高質量數據篩選
採用嚴格的數據質量控制框架,確保訓練數據的高質量和多樣性

模型能力

數學問題求解
通用知識問答
多輪對話
複雜推理任務處理
中英雙語處理

使用案例

教育
數學輔導
幫助學生解決各類數學問題,提供分步解題指導
在MATH-500測試中達到97.0分
知識問答
回答各類學科知識問題
在MMLU專業版測試中達到92.6分
研究
數學研究輔助
輔助研究人員進行數學問題探索和驗證
在AIME-25測試中達到73.3分
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase