D

Deepseek R1 Distill Phi 3 Mini 4k Lorar8 Alpha16 50000samples

由GPD1開發
基於Deepseek-R1知識蒸餾的推理模型,支持鏈式思維(CoT)推理能力
下載量 71
發布時間 : 1/31/2025

模型概述

該模型是通過知識蒸餾技術從Deepseek-R1和Llama-70B模型提取的推理模型,專注於提升複雜推理任務的表現。

模型特點

知識蒸餾
從Deepseek-R1和Llama-70B大型模型中提取知識,保持高性能的同時減小模型規模
鏈式思維推理
支持CoT(Chain-of-Thought)推理能力,適合解決複雜推理問題
高效推理
基於Phi-3-mini架構優化,在保持性能的同時提高推理效率

模型能力

文本生成
複雜邏輯推理
知識問答
思維鏈推理

使用案例

教育
數學問題求解
解決需要多步推理的數學問題
研究
科學推理
輔助進行科學假設的推理和驗證
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase