# 低精度推理

Devstral Small 2505 Bf16
Apache-2.0
Devstral-Small-2505-bf16 是一个基于 MistralAI 的 Devstral-Small-2505 模型转换而来的 MLX 格式模型,支持多种语言处理任务。
大型语言模型 支持多种语言
D
mlx-community
207
1
Medgemma 4b It 8bit
其他
MedGemma-4B-IT-8bit是Google MedGemma模型的MLX格式转换版本,专注于医疗领域的视觉语言任务。
图像生成文本 Transformers
M
mlx-community
116
1
Qwen2.5 VL 3B Instruct MLX 8bits
这是一个基于Qwen2.5-VL-3B-Instruct模型的8位量化版本,专为MLX框架优化,支持图像文本生成任务。
图像生成文本 Transformers 英语
Q
moot20
27
1
Controlnet Noobai Openpose Sdxl Fp16
基于Stable Diffusion XL的ControlNet模型,专注于OpenPose姿态控制,用于生成符合特定人体姿态的图像。
图像生成
C
r3gm
37
0
Bge Reranker V2 Gemma IQ4 NL GGUF
Apache-2.0
这是BAAI/bge-reranker-v2-gemma模型的GGUF格式转换版本,适用于llama.cpp框架,支持多语言文本分类任务。
文本嵌入 其他
B
zimajava
20
1
Blip2 Opt 2.7b 8bit
MIT
BLIP-2是一个视觉语言预训练模型,结合了图像编码器和大型语言模型,用于图像到文本的生成任务。
图像生成文本 Transformers 英语
B
Mediocreatmybest
69
2
Vit Base Patch16 224 Int8 Static Inc
Apache-2.0
这是一个使用Intel® Neural Compressor进行训练后静态量化的INT8 PyTorch模型,基于Google的ViT模型微调而来,在保持较高准确率的同时大幅减小模型体积。
图像分类 Transformers
V
Intel
82
1
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase