L

Llama 3.2 3B Instruct FP8 Dynamic

由RedHatAI開發
Llama-3.2-3B-Instruct的FP8量化版本,適用於多語言的商業和研究用途,特別適合類似助手的聊天場景。
下載量 986
發布時間 : 9/25/2024

模型概述

該模型是Meta-Llama-3.2-3B-Instruct的量化版本,通過將權重和激活量化為FP8數據類型,減少了磁盤大小和GPU內存需求約50%。

模型特點

FP8量化
權重和激活量化為FP8數據類型,減少磁盤大小和GPU內存需求約50%。
多語言支持
支持多種語言,包括英語、德語、法語、意大利語、葡萄牙語、印地語、西班牙語和泰語。
高效推理
優化後的模型適用於vLLM後端進行高效推理。

模型能力

文本生成
多語言聊天
商業和研究用途

使用案例

聊天機器人
多語言聊天助手
適用於類似助手的聊天場景,支持多種語言。
在OpenLLM基準測試中平均得分為50.88。
商業應用
商業諮詢
提供商業諮詢和問答服務。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase