M

Meta Llama 3.3 70B Instruct AWQ INT4

由ibnzterrell開發
Llama 3.3 70B Instruct AWQ INT4 是 Meta Llama 3.3 70B Instruct 模型的 4 位量化版本,適用於多語言對話用例,優化了文本生成任務。
下載量 6,410
發布時間 : 12/7/2024

模型概述

這是一個預訓練並經過指令調優的 700 億參數生成模型,針對多語言對話用例進行了優化,支持多種語言,性能優於許多開源和閉源聊天模型。

模型特點

高效量化
使用 AutoAWQ 從 FP16 量化至 INT4,採用 GEMM 內核、零點量化和 128 的分組大小,顯著減少顯存佔用。
多語言支持
支持多種語言,包括英語、法語、意大利語、葡萄牙語、印地語、西班牙語、泰語和德語。
高性能
在常見的行業基準測試中表現優於許多開源和閉源聊天模型。

模型能力

多語言文本生成
對話系統
指令調優

使用案例

對話系統
多語言客服助手
用於構建支持多種語言的客服助手,提供高效、準確的回答。
優化了對話體驗,支持多語言交互。
內容生成
多語言內容創作
生成多語言的文章、報告或其他文本內容。
提高內容創作的效率和質量。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase