D

Deepseek R1 Distill Qwen 7B Japanese

Developed by lightblue
這是DeepSeek R1模型的日語版本,專門針對日語推理任務進行微調,能夠可靠且準確地以日語響應提示。
Downloads 1,067
Release Time : 1/24/2025

Model Overview

該模型是基於DeepSeek-R1-Distill-Qwen-7B在日語推理數據集上進行微調的版本,解決了原模型在日語提示下輸出不一致的問題。

Model Features

日語優化
專門針對日語進行微調,解決了原模型在日語提示下輸出不一致的問題
高效訓練
在阿里雲8 x L20實例上訓練不到10分鐘即完成
推理能力
保留了原模型的優秀推理能力,特別適合解決數學和邏輯問題
輸出一致性
相比原模型,在日語輸出上更加穩定和可靠

Model Capabilities

日語文本生成
數學推理
邏輯問題解答
多輪對話

Use Cases

教育
數學問題解答
解答日語數學問題,特別是需要多步推理的問題
在GSM8K日語測試集上達到70%準確率
客服
日語客戶諮詢
處理日語客戶的諮詢和問題
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase