# 超低比特量化

Holo1 3B GGUF
其他
Holo1-3B是基于Transformer架构的多模态模型,专注于视觉文档检索任务,在WebVoyager基准测试中表现出色,平衡了准确性和成本。
图像生成文本 Transformers 英语
H
Mungert
583
0
Holo1 7B GGUF
Apache-2.0
Holo1-7B GGUF模型是Surfer-H系统的一部分,适用于视觉文档检索等多模态任务,特别擅长网页交互和网络监控,能以较低成本实现高准确性。
图像生成文本 Transformers 英语
H
Mungert
663
0
Devstral Small 2505 GGUF
Apache-2.0
专为软件工程项目打造的高效语言模型,轻量级设计,支持128k大上下文窗口,适用于复杂编码任务。
大型语言模型 支持多种语言
D
Mungert
1,409
1
Qwq 32B ArliAI RpR V4 GGUF
Apache-2.0
基于Qwen/QwQ-32B的文本生成模型,专注于角色扮演和创意写作任务,支持超低比特量化和长对话处理。
大型语言模型 Transformers 英语
Q
Mungert
523
2
Kanana 1.5 8b Instruct 2505 GGUF
Apache-2.0
Kanana 1.5 是 Kanana 模型系列的新版本,在编码、数学和函数调用能力方面有显著提升,能够处理长达32K个令牌的输入,使用YaRN时可处理多达128K个令牌。
大型语言模型 Transformers 支持多种语言
K
Mungert
606
2
Medgemma 4b It GGUF
其他
MedGemma-4B-IT是基于Gemma 3的医学领域多模态模型,支持医学文本和图像理解,适用于医疗AI应用开发。
图像生成文本 Transformers
M
Mungert
637
2
Medgemma 27b Text It GGUF
其他
MedGemma-27B-Text-IT是基于Gemma 3架构的医疗专用大语言模型,针对医疗文本处理进行了优化,提供多种量化版本以适应不同硬件环境。
大型语言模型 Transformers
M
Mungert
1,464
3
Qwenlong L1 32B GGUF
Apache-2.0
QwenLong-L1-32B 是专为长上下文推理设计的大语言模型,通过强化学习训练,在多个长上下文问答基准测试中表现出色,能有效处理复杂的推理任务。
大型语言模型 Transformers
Q
Mungert
927
7
Dans PersonalityEngine V1.3.0 24b GGUF
Apache-2.0
Dans-PersonalityEngine-V1.3.0-24b是一个多功能模型系列,在50多个专业数据集上进行了微调,支持多语言和专业领域任务。
大型语言模型 Transformers
D
Mungert
678
2
Qwen3 30B A6B 16 Extreme GGUF
基于Qwen/Qwen3-30B-A3B-Base生成的超低比特量化模型,支持32k上下文长度,适用于多种硬件环境
大型语言模型 Transformers
Q
Mungert
1,321
1
Llama 3.1 Nemotron Nano 4B V1.1 GGUF
其他
Llama-3.1-Nemotron-Nano-4B-v1.1是一款基于Llama 3.1优化的大语言模型,在准确性和效率间取得良好平衡,适用于AI代理、聊天机器人等多种场景。
大型语言模型 Transformers 英语
L
Mungert
2,177
1
Opencodereasoning Nemotron 32B IOI GGUF
Apache-2.0
基于Qwen2.5-32B-Instruct的大语言模型,专为代码生成推理而进行了后训练,支持32K上下文长度,适用于商业和非商业用途。
大型语言模型 Transformers
O
Mungert
1,317
2
UI TARS 1.5 7B GGUF
Apache-2.0
UI-TARS-1.5-7B是基于先进技术的多模态模型,在图像文本转换等任务中表现出色,采用创新的量化方法,能在极低比特率下保持较高的准确性。
文本生成图像 Transformers
U
Mungert
2,526
3
Phi 4 Mini Reasoning GGUF
MIT
Phi-4-mini-reasoning 是一个基于合成数据构建的轻量级开放模型,专注于高质量、富含推理的数据,并针对更高级的数学推理能力进行了进一步微调。
大型语言模型 Transformers
P
Mungert
3,592
3
Foundation Sec 8B GGUF
Apache-2.0
Foundation-Sec-8B是一款专为网络安全应用设计的语言模型,基于Llama-3.1架构,经过大量网络安全相关文本数据的预训练,能够理解和处理多种网络安全领域的概念、术语和实践。
大型语言模型 Transformers 英语
F
Mungert
7,603
4
Qwen3 14B GGUF
Apache-2.0
Qwen3-14B是基于Qwen/Qwen3-14B-Base生成的GGUF格式模型,支持文本生成任务,采用IQ-DynamicGate超低比特量化技术优化内存效率。
大型语言模型
Q
Mungert
1,597
6
Qwen2.5 7B Instruct GGUF
Apache-2.0
Qwen2.5-7B-Instruct是基于Qwen2.5-7B的指令微调模型,支持文本生成任务,特别优化了聊天场景下的表现。
大型语言模型 英语
Q
Mungert
706
4
Olympiccoder 7B GGUF
Apache-2.0
OlympicCoder-7B是基于Qwen2.5-Coder-7B-Instruct优化的代码生成模型,采用IQ-DynamicGate超低比特量化技术,专为内存受限环境设计。
大型语言模型 英语
O
Mungert
849
3
Phi 2 GGUF
MIT
phi-2 是一个采用 IQ-DynamicGate 超低比特量化(1-2 比特)的文本生成模型,适用于自然语言处理和代码生成任务。
大型语言模型 支持多种语言
P
Mungert
472
2
GLM Z1 32B 0414 GGUF
MIT
GLM-Z1-32B-0414是一个32B参数规模的多语言文本生成模型,支持中文和英文,采用MIT许可证发布。
大型语言模型 支持多种语言
G
Mungert
994
3
GLM 4 32B 0414 GGUF
MIT
GLM-4-32B-0414 GGUF模型是一系列强大的文本生成模型,具有多种量化格式,适用于不同硬件和内存条件。
大型语言模型 Transformers 支持多种语言
G
Mungert
817
4
Llama 3.1 Nemotron 70B Instruct HF GGUF
基于Meta Llama-3.1-70B-Instruct微调的模型,采用NVIDIA HelpSteer2数据集优化,支持文本生成任务。
大型语言模型 英语
L
Mungert
1,434
3
Orpheus 3b 0.1 Ft GGUF
Apache-2.0
基于Llama-3-8B架构优化的超低比特量化模型,采用IQ-DynamicGate技术实现1-2比特精度自适应量化,适用于内存受限环境。
大型语言模型 英语
O
Mungert
1,427
1
Olmo 2 0325 32B Instruct GGUF
Apache-2.0
基于OLMo-2-0325-32B-DPO的指令微调模型,采用IQ-DynamicGate超低比特量化技术,专为内存受限环境优化。
大型语言模型 英语
O
Mungert
15.57k
2
Qwen2.5 VL 7B Instruct GGUF
Apache-2.0
Qwen2.5-VL-7B-Instruct 是一个多模态视觉语言模型,支持图像理解和文本生成任务。
图像生成文本 英语
Q
Mungert
17.10k
10
Llama 3.1 Nemotron Nano 8B V1 GGUF
其他
基于Llama-3架构的8B参数模型,采用IQ-DynamicGate超低比特量化技术优化内存使用
大型语言模型 英语
L
Mungert
2,088
4
Granite 3.2 8b Instruct GGUF
Apache-2.0
IBM Granite系列8B参数指令微调语言模型,采用IQ-DynamicGate超低比特量化技术,适用于高效推理场景
大型语言模型
G
Mungert
1,048
2
Mistral Small 3.1 24B Instruct 2503 GGUF
Apache-2.0
这是一个基于 Mistral-Small-3.1-24B-Base-2503 的指令微调模型,采用 GGUF 格式和 IQ-DynamicGate 超低比特量化技术。
大型语言模型 支持多种语言
M
Mungert
10.01k
7
Qwen2.5 14B Instruct 1M GGUF
Apache-2.0
Qwen2.5-14B-Instruct-1M 是一个基于 Qwen2.5-14B 的指令微调模型,支持文本生成任务,适用于聊天场景。
大型语言模型 英语
Q
Mungert
1,600
3
Mistral 7B Instruct V0.2 GGUF
Apache-2.0
Mistral-7B-Instruct-v0.2是基于Mistral-7B架构的指令微调模型,支持文本生成任务,采用IQ-DynamicGate超低比特量化技术优化内存效率。
大型语言模型
M
Mungert
742
2
Mistral 7B Instruct V0.1 GGUF
Apache-2.0
Mistral-7B-Instruct-v0.1是一个基于Mistral-7B-v0.1的微调模型,支持文本生成任务,采用IQ-DynamicGate超低比特量化技术,适用于内存受限的部署环境。
大型语言模型
M
Mungert
632
3
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase