B

Baidu ERNIE 4.5 21B A3B PT GGUF

由 bartowski 开发
百度ERNIE-4.5-21B-A3B-PT模型的量化版本,通过llama.cpp进行量化处理,提升在不同硬件环境下的运行效率和性能。
下载量 1,600
发布时间 : 6/30/2025

模型简介

该模型是百度ERNIE-4.5-21B-A3B-PT的量化版本,旨在通过量化技术优化模型在各类硬件上的运行效率,同时保持较高的模型性能。

模型特点

高效量化
使用llama.cpp进行量化处理,支持多种量化类型,从高精度到低精度,满足不同硬件需求。
硬件兼容性
支持在LM Studio和llama.cpp等平台上运行,适配多种硬件环境。
嵌入和输出权重优化
部分量化模型对嵌入和输出权重进行了特殊处理,采用Q8_0量化,提升模型性能。
在线重新打包
支持权重在线重新打包,优化在ARM和AVX硬件上的运行效率。

模型能力

文本生成
高效推理
多硬件适配

使用案例

文本生成
内容创作
用于生成高质量的文章、故事或其他文本内容。
生成流畅、连贯的文本
对话系统
用于构建智能对话机器人,提供自然语言交互能力。
实现自然、流畅的对话
研究与开发
模型量化研究
用于研究不同量化方法对模型性能的影响。
提供多种量化选项,便于对比分析
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase