D

Doge 160M Reason Distill

由SmallDoge開發
Doge 160M 推理蒸餾版是一個基於動態掩碼注意力機制和跨域混合專家的輕量級語言模型,專注於推理和問答任務。
下載量 26
發布時間 : 2/18/2025

模型概述

該模型採用動態掩碼注意力機制進行序列變換,可選擇多層感知機或跨域混合專家進行狀態轉換。動態掩碼注意力機制使Transformer能在訓練時使用自注意力機制,在推理時切換為狀態空間機制。

模型特點

動態掩碼注意力機制
允許在訓練時使用自注意力機制,在推理時切換為狀態空間機制,提高推理效率。
跨域混合專家
可直接繼承多層感知機的權重進行後續訓練,提高模型適應性。
推理蒸餾
在Reason-Distill數據集上進行監督微調,優化推理能力。

模型能力

問答生成
邏輯推理
數學問題解答

使用案例

教育
數學問題解答
解答基礎數學比較和計算問題
能正確比較數字大小並提供推理過程
智能助手
系統化問題解答
按照特定格式提供詳細思考過程和解決方案
能生成結構化的思考過程和最終解決方案
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase