M

Mythomax L2 13B AWQ

由TheBloke開發
MythoMax L2 13B 的 AWQ 量化版本,能有效提升推理效率。
下載量 1,555
發布時間 : 9/19/2023

模型概述

這是一個基於 Gryphe 的 MythoMax L2 13B 模型的 AWQ 量化版本,主要用於高效推理任務。

模型特點

高效量化
採用 AWQ 量化方法,支持 4 位量化,相比 GPTQ 能提供更快的基於 Transformer 的推理。
多平臺支持
支持連續批處理服務器 vLLM,可在多用戶服務器場景中實現高吞吐量併發推理。
多格式可用
提供 AWQ、GPTQ、GGUF 等多種量化格式的模型文件,以及原始的未量化 fp16 模型。

模型能力

文本生成
高效推理
多用戶併發處理

使用案例

文本生成
對話生成
用於生成自然語言對話回覆。
生成流暢、連貫的對話內容。
內容創作
用於輔助寫作、故事生成等創意內容創作。
生成富有創意的文本內容。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase