L

Llama 3.3 70B Instruct FP8 Dynamic

Developed by RedHatAI
Llama-3.3-70B-Instruct-FP8-dynamic 是經過優化的大語言模型,通過將激活和權重量化為 FP8 數據類型,減少了 GPU 內存需求並提高了計算吞吐量,支持多語言的商業和研究用途。
Downloads 6,060
Release Time : 12/11/2024

Model Overview

指令微調的文本模型適用於類似助手的聊天場景,預訓練模型可適應各種自然語言生成任務,並且 Llama 3.3 模型還支持利用其模型的輸出來改進其他模型,包括合成數據生成和蒸餾。

Model Features

FP8 量化優化
通過將激活和權重量化為 FP8 數據類型,減少了 GPU 內存需求(約 50%),並提高了矩陣乘法的計算吞吐量(約 2 倍),同時也將磁盤大小需求減少了約 50%。
多語言支持
支持英語、法語、意大利語、葡萄牙語、印地語、西班牙語、泰語和德語等多種語言,適用於不同語言環境的商業和研究用途。
高效部署
支持使用 vLLM 後端進行高效部署,併兼容 OpenAI 兼容的服務。

Model Capabilities

文本生成
多語言支持
聊天助手
自然語言處理
指令微調

Use Cases

商業和研究
多語言聊天助手
適用於不同語言環境的商業和研究用途,提供類似助手的聊天場景支持。
自然語言生成
預訓練模型可適應各種自然語言生成任務。
模型改進
合成數據生成
利用模型的輸出來改進其他模型,包括合成數據生成和蒸餾。
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase