D

Deepseek Qwen Bllossom 32B

由UNIVA-Bllossom開發
DeepSeek-qwen-Bllossom-32B是基於DeepSeek-R1-Distill-Qwen-32B模型構建的,旨在提升韓語環境下的推理性能。
下載量 167
發布時間 : 4/7/2025

模型概述

該模型通過額外訓練克服了原基礎模型在韓語推理時的性能下降問題,實現了內部思考過程以英語進行,最終根據用戶輸入語言輸出響應,大幅提升了韓語環境下的推理表現。

模型特點

多語言推理能力
內部思考過程以英語進行,最終根據用戶輸入語言輸出響應,顯著提升韓語推理性能。
高質量訓練數據
訓練數據包含韓英雙語推理數據集,涵蓋多領域內容,提供更準確可靠的韓語推理結果。
高效蒸餾方法
採用大模型優秀推理能力向基礎模型高效蒸餾的方法,有效彌補原模型不足。

模型能力

韓語文本生成
英語文本生成
複雜推理任務
多領域知識問答

使用案例

教育
數學問題解答
解決複雜的數學推理問題,如分數計算、代數問題等。
在AIME24_ko基準測試中達到66.67分,顯著優於原模型。
研究
數學定理證明
提供多種數學定理的證明方法,如素數無限的證明。
能提供多種角度的證明方法,包括歐幾里得反證法、階乘法和歐拉ζ函數法。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase