M

Mythomax L2 13B AWQ

由 TheBloke 开发
MythoMax L2 13B 的 AWQ 量化版本,能有效提升推理效率。
下载量 1,555
发布时间 : 9/19/2023

模型简介

这是一个基于 Gryphe 的 MythoMax L2 13B 模型的 AWQ 量化版本,主要用于高效推理任务。

模型特点

高效量化
采用 AWQ 量化方法,支持 4 位量化,相比 GPTQ 能提供更快的基于 Transformer 的推理。
多平台支持
支持连续批处理服务器 vLLM,可在多用户服务器场景中实现高吞吐量并发推理。
多格式可用
提供 AWQ、GPTQ、GGUF 等多种量化格式的模型文件,以及原始的未量化 fp16 模型。

模型能力

文本生成
高效推理
多用户并发处理

使用案例

文本生成
对话生成
用于生成自然语言对话回复。
生成流畅、连贯的对话内容。
内容创作
用于辅助写作、故事生成等创意内容创作。
生成富有创意的文本内容。
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase