D

Deepseek R1 Chinese Law

由corn6開發
基於Unsloth和Huggingface TRL庫訓練的Llama模型,推理速度提升2倍
下載量 74
發布時間 : 4/3/2025

模型概述

這是一個經過蒸餾和優化的8B參數Llama模型,使用Unsloth框架和TRL庫進行訓練,專注於文本生成任務。

模型特點

高效訓練
使用Unsloth框架訓練,速度提升2倍
4位量化
採用4位量化技術(BNB-4bit),降低資源需求
蒸餾優化
基於deepseek-r1的蒸餾版本,保持性能的同時減小模型體積

模型能力

文本生成
文本推理

使用案例

文本生成
內容創作
自動生成文章、故事等文本內容
對話系統
構建智能對話助手
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase