L

Llama 3.3 70B Instruct FP8 Dynamic

由RedHatAI開發
Llama-3.3-70B-Instruct-FP8-dynamic 是經過優化的大語言模型,通過將激活和權重量化為 FP8 數據類型,減少了 GPU 內存需求並提高了計算吞吐量,支持多語言的商業和研究用途。
下載量 6,060
發布時間 : 12/11/2024

模型概述

指令微調的文本模型適用於類似助手的聊天場景,預訓練模型可適應各種自然語言生成任務,並且 Llama 3.3 模型還支持利用其模型的輸出來改進其他模型,包括合成數據生成和蒸餾。

模型特點

FP8 量化優化
通過將激活和權重量化為 FP8 數據類型,減少了 GPU 內存需求(約 50%),並提高了矩陣乘法的計算吞吐量(約 2 倍),同時也將磁盤大小需求減少了約 50%。
多語言支持
支持英語、法語、意大利語、葡萄牙語、印地語、西班牙語、泰語和德語等多種語言,適用於不同語言環境的商業和研究用途。
高效部署
支持使用 vLLM 後端進行高效部署,併兼容 OpenAI 兼容的服務。

模型能力

文本生成
多語言支持
聊天助手
自然語言處理
指令微調

使用案例

商業和研究
多語言聊天助手
適用於不同語言環境的商業和研究用途,提供類似助手的聊天場景支持。
自然語言生成
預訓練模型可適應各種自然語言生成任務。
模型改進
合成數據生成
利用模型的輸出來改進其他模型,包括合成數據生成和蒸餾。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase