Devstral Small 2505 GGUF
D
Devstral Small 2505 GGUF
由 Antigma 开发
Devstral-Small-2505的量化版本,提供多种精度选择以适应不同硬件需求
下载量 170
发布时间 : 5/22/2025
模型简介
该模型是Devstral-Small-2505的GGUF量化版本,适用于本地推理场景,提供从2位到8位的多种量化精度选择,平衡模型质量与计算资源消耗
模型特点
多级量化选择
提供从Q2_K到Q8_0共6种量化级别,满足不同场景下的精度与性能需求
硬件适配性强
量化模型显著减小内存占用,使模型能在消费级硬件上运行
高效推理
通过量化技术优化推理速度,同时保持可接受的模型质量
模型能力
文本生成
本地推理
使用案例
本地应用
个人助手
在本地设备上部署个性化AI助手
低延迟响应,保护隐私
内容创作
支持离线环境下的创意写作和内容生成
平衡生成质量与资源消耗
研究开发
模型量化研究
研究不同量化级别对模型性能的影响
提供多种量化级别对比
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers 支持多种语言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers 英语

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统 中文
R
uer
2,694
98