D

Deepseek R1 BF16

由unsloth開發
DeepSeek-R1是基於Llama架構的8B參數模型,由DeepSeek團隊開發,專注於高效推理和微調。
下載量 944
發布時間 : 1/20/2025

模型概述

該模型是DeepSeek-R1系列的蒸餾版本,基於Llama架構,適用於文本生成和對話任務。

模型特點

高效推理
支持在llama.cpp中高效運行,提供多種量化選項。
微調優化
使用Unsloth工具可顯著提升微調速度並減少內存使用。
多格式支持
提供GGUF、4-bit和原始格式,適應不同部署需求。

模型能力

文本生成
對話系統
數學推理

使用案例

教育
數學問題解答
解答基礎數學問題,如加法運算。
能夠逐步推理並給出正確答案。
對話系統
日常對話
模擬自然對話流程。
生成連貫且有邏輯的回覆。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase