Deepseek R1 Distill Llama 8B Abliterated
D
Deepseek R1 Distill Llama 8B Abliterated
由stepenZEN開發
DeepSeek-R1-Distill-Llama-8B 是一個基於 Llama 架構的蒸餾版大語言模型,參數規模為 8B,主要用於英文文本生成和理解任務。
下載量 119
發布時間 : 1/20/2025
模型概述
該模型是 DeepSeek 發佈的 R1 系列模型之一,通過蒸餾技術從更大的模型中提取知識,保持了較高的性能同時減少了計算資源需求。
模型特點
蒸餾技術
通過蒸餾技術從更大的模型中提取知識,在保持性能的同時減少模型規模。
高效推理
8B 參數規模在保證性能的同時,降低了計算資源需求,適合更多應用場景。
英文優化
針對英文文本生成和理解任務進行了優化。
模型能力
文本生成
文本理解
問答系統
內容摘要
使用案例
內容生成
文章創作
生成高質量英文文章或段落
生成流暢、連貫的英文內容
對話系統
構建英文對話機器人
實現自然流暢的英文對話
文本理解
問答系統
回答基於英文文本的問題
準確理解問題並提供相關回答
內容摘要
生成英文文本的摘要
提取關鍵信息生成簡潔摘要
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98