E

Elastic DeepSeek R1 Distill Qwen 7B

由TheStageAI開發
DeepSeek-R1-Distill-Qwen-7B 是一個基於 Qwen-7B 的蒸餾模型,支持多種語言,適用於文本生成任務。
下載量 78
發布時間 : 4/25/2025

模型概述

該模型是一個經過優化的文本生成模型,支持多種語言,適用於自託管場景,提供靈活的模型大小、延遲與質量調整選項。

模型特點

彈性模型
通過滑動控制條靈活調整模型大小、延遲與質量,提供 XL、L、M、S 四種優化版本。
多語言支持
支持 13 種語言,包括中文、英語、法語、西班牙語等。
高性能推理
在 H100 和 L40S GPU 上提供高效的推理性能,S 版在保持速度的同時顯著提升質量。

模型能力

文本生成
多語言支持
自託管優化

使用案例

搜索助手
問答系統
回答用戶提問,提供高質量的文本生成結果。
在 MMLU 和 PIQA 等基準測試中表現優異。
多語言應用
多語言翻譯
支持多種語言的文本生成和翻譯任務。
在多種語言環境下保持高質量的生成效果。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase