D

Deepseek R1 Distill Qwen 7B Japanese

由lightblue開發
這是DeepSeek R1模型的日語版本,專門針對日語推理任務進行微調,能夠可靠且準確地以日語響應提示。
下載量 1,067
發布時間 : 1/24/2025

模型概述

該模型是基於DeepSeek-R1-Distill-Qwen-7B在日語推理數據集上進行微調的版本,解決了原模型在日語提示下輸出不一致的問題。

模型特點

日語優化
專門針對日語進行微調,解決了原模型在日語提示下輸出不一致的問題
高效訓練
在阿里雲8 x L20實例上訓練不到10分鐘即完成
推理能力
保留了原模型的優秀推理能力,特別適合解決數學和邏輯問題
輸出一致性
相比原模型,在日語輸出上更加穩定和可靠

模型能力

日語文本生成
數學推理
邏輯問題解答
多輪對話

使用案例

教育
數學問題解答
解答日語數學問題,特別是需要多步推理的問題
在GSM8K日語測試集上達到70%準確率
客服
日語客戶諮詢
處理日語客戶的諮詢和問題
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase