E

Elastic DeepSeek R1 Distill Llama 8B

由TheStageAI開發
由TheStage AI的ANNA生成的彈性模型,提供多種優化版本以適應不同場景需求,支持多語言文本生成。
下載量 60
發布時間 : 4/24/2025

模型概述

DeepSeek-R1-Distill-Llama-8B是一個基於Llama架構的8B參數大語言模型,通過ANNA技術提供多種優化版本(XL/L/M/S),在自託管場景下實現高效推理。

模型特點

彈性版本選擇
提供XL/L/M/S四種優化版本,用戶可根據需求在模型質量與推理速度間靈活權衡
多硬件支持
支持H100/L40s GPU和AMD/Intel CPU,預編譯無需即時編譯
多語言能力
支持13種語言的文本生成任務
量化優化
ANNA技術優化敏感層量化效果,S版在保持速度的同時顯著提升質量

模型能力

多語言文本生成
知識問答
常識推理
語境理解

使用案例

智能助手
搜索問答助手
回答用戶各類知識性問題
在MMLU測試中達到54.7-55.5分(滿分100)
內容生成
多語言內容創作
生成13種語言的營銷文案或社交媒體內容
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase