L

Llama 3.2 1B Instruct FP8

由RedHatAI開發
Llama-3.2-1B-Instruct的FP8量化版本,適用於多語言場景的商業和研究用途,性能接近原始模型。
下載量 1,718
發布時間 : 9/26/2024

模型概述

這是一個基於Llama-3架構的1B參數指令微調模型,經過FP8量化優化,適用於類助手式對話場景。

模型特點

FP8量化
權重和激活均採用FP8量化,減少50%內存需求,提升2倍計算吞吐量
多語言支持
支持8種語言的文本生成任務
高性能保持
在多個基準測試中性能損失小於1%,接近原始模型
高效部署
支持vLLM後端部署,提供OpenAI兼容服務

模型能力

多語言文本生成
助手式對話
知識問答
任務完成

使用案例

智能助手
多語言客服機器人
部署為支持多種語言的在線客服助手
可處理常見客戶諮詢,支持8種語言
教育
語言學習助手
作為語言學習者的對話練習夥伴
提供多語言互動體驗
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase