高精度量化

# 高精度量化

Gama-12B是一个多语言支持的大语言模型，提供多种量化版本以适应不同性能和精度需求。

大型语言模型

Transformers 支持多种语言

Acereason Nemotron 1.1 7B GGUF

英伟达推出的高性能7B参数语言模型，专注于数学和代码推理任务，支持128k上下文长度。

大型语言模型支持多种语言

lmstudio-community

Delta Vector Austral 24B Winton GGUF

Delta-Vector的Austral-24B-Winton模型的量化版本，使用llama.cpp工具进行量化处理，适用于不同硬件配置的高效运行。

大型语言模型英语

Cognitivecomputations Qwen3 72B Embiggened GGUF

基于cognitivecomputations/Qwen3-72B-Embiggened模型的量化版本，使用llama.cpp进行量化处理，可在多种环境下高效运行。

大型语言模型

Openbuddy OpenBuddy R1 0528 Distill Qwen3 32B Preview0 QAT GGUF

这是OpenBuddy-R1-0528-Distill-Qwen3-32B-Preview0-QAT的量化版本，借助量化技术可以在不同硬件条件下更高效地运行模型。

大型语言模型支持多种语言

Infly Inf O1 Pi0 GGUF

基于infly/inf-o1-pi0模型的量化版本，支持多语言文本生成任务，采用llama.cpp工具进行imatrix量化优化。

大型语言模型支持多种语言

Allura Org Q3 30B A3B Designant GGUF

基于allura-org/Q3-30B-A3B-Designant的Llamacpp imatrix量化版本，适用于多种量化需求，支持角色扮演和对话式任务。

大型语言模型

Pocketdoc Dans PersonalityEngine V1.3.0 12b GGUF

一个基于llama.cpp量化的12B参数多语言大语言模型，支持角色扮演、故事创作及多领域专业任务

大型语言模型

Pocketdoc Dans PersonalityEngine V1.3.0 24b GGUF

一个多语言、多用途的大型语言模型，支持多种专业领域和通用任务，适用于角色扮演、故事创作、编程等多种场景。

大型语言模型

Allura Org Q3 30b A3b Pentiment GGUF

Q3-30b-A3b-Pentiment 是一个基于 LLaMA 架构的大型语言模型，经过量化处理，适用于多种文本生成任务。

大型语言模型

Qwen3是通义千问系列最新一代大语言模型，提供稠密模型和混合专家（MoE）模型的完整套件。基于大规模训练，Qwen3在推理能力、指令遵循、智能体功能和多语言支持方面实现了突破性进展。

大型语言模型英语

Qwen3 1.7B GGUF

Qwen3是通义千问系列大语言模型的最新版本，提供了一系列密集型和混合专家（MoE）模型。基于大规模训练，Qwen3在推理、指令遵循、智能体能力和多语言支持方面实现了突破性进展。

大型语言模型英语

Primeintellect INTELLECT 2 GGUF

INTELLECT-2的量化版本，使用llama.cpp进行优化，支持多种量化类型以适应不同硬件需求。

大型语言模型

Gryphe Pantheon Proto RP 1.8 30B A3B GGUF

这是一个基于Gryphe/Pantheon-Proto-RP-1.8-30B-A3B模型的量化版本，使用llama.cpp进行量化，适用于角色扮演和文本生成任务。

大型语言模型英语

Cognitivecomputations Dolphin Mistral 24B Venice Edition GGUF

Dolphin-Mistral-24B-Venice-Edition的Llamacpp imatrix量化版本，支持多种量化类型，适用于文本生成任务。

大型语言模型

Qwen Qwen2.5 VL 72B Instruct GGUF

Qwen2.5-VL-72B-Instruct的多模态大语言模型量化版本，支持图像文本到文本任务，适用于多种量化级别，从高精度到低内存需求。

文本生成图像英语

Qwen Qwen2.5 VL 7B Instruct GGUF

Qwen2.5-VL-7B-Instruct的量化版本，使用llama.cpp进行量化，支持多模态任务，适用于图文转文本等应用场景。

文本生成图像英语

Nvidia OpenCodeReasoning Nemotron 32B IOI GGUF

这是NVIDIA OpenCodeReasoning-Nemotron-32B-IOI模型的量化版本，使用llama.cpp进行量化处理，适用于代码推理任务。

大型语言模型支持多种语言

Nomic Ai Nomic Embed Code GGUF

这是nomic-ai/nomic-embed-code模型的量化版本，使用llama.cpp进行imatrix量化，适用于代码嵌入和特征提取任务。

Huihui Ai Qwen3 14B Abliterated GGUF

Qwen3-14B-abliterated是基于Qwen3-14B模型的量化版本，使用llama.cpp进行优化，提供多种量化选项以适应不同性能需求。

大型语言模型

Goekdeniz Guelmez Josiefied Qwen3 8B Abliterated V1 GGUF

这是Qwen3-8B模型的量化版本，使用llama.cpp进行imatrix量化，适用于聊天场景。

大型语言模型

Allura Org Remnant Glm4 32b GGUF

Remnant-GLM4-32B 是一个基于 GLM4 架构的 32B 参数大语言模型，支持角色扮演和对话式交互，特别适合蝾螈相关的应用场景。

大型语言模型

Nomic Embed Code GGUF

Nomic代码嵌入模型是一款顶尖的代码检索工具，支持多种编程语言，擅长代码检索任务。

Mlabonne Qwen3 14B Abliterated GGUF

这是Qwen3-14B-abliterated模型的量化版本，使用llama.cpp的imatrix选项进行量化，适用于文本生成任务。

大型语言模型

Qwen Qwen3 32B GGUF

基于Qwen/Qwen3-32B的量化版本，使用llama.cpp进行量化，支持多种量化类型，适用于不同硬件需求。

大型语言模型

Qwen Qwen3 30B A3B GGUF

基于Qwen/Qwen3-30B-A3B的量化版本，使用llama.cpp进行多种精度量化，适用于文本生成任务。

大型语言模型

Nvidia OpenMath Nemotron 14B Kaggle GGUF

这是NVIDIA开源的14B参数数学大语言模型，经过llama.cpp量化处理，可在不同硬件条件下高效运行。

大型语言模型英语

Mistral Small 24B Instruct 2501 GGUF

Mistral-Small-24B-Instruct-2501 是一个24B参数规模的指令微调大语言模型，支持多语言文本生成任务。

大型语言模型支持多种语言

Pocketdoc Dans SakuraKaze V1.0.0 12b GGUF

基于PocketDoc/Dans-SakuraKaze-V1.0.0-12b的Llamacpp imatrix量化版本，支持多种量化类型，适用于文本生成任务。

大型语言模型英语

Glm 4 9b Chat Abliterated GGUF

基于GLM-4架构的9B参数聊天模型，支持中英文对话，经过量化处理适用于不同硬件环境

大型语言模型支持多种语言

Llama 3.3 70B Instruct Abliterated GGUF

基于Llama 3.3架构的70B参数大语言模型，支持多语言文本生成任务，经过量化优化适用于不同硬件环境

大型语言模型支持多种语言

Zero Mistral 24B Gguf

Zero-Mistral-24B 是一个基于 Mistral 架构的大型语言模型，支持俄语和英语，适用于对话和文本生成任务。

大型语言模型支持多种语言

Google Gemma 3 27b It Qat GGUF

基于Google Gemma 3 270亿参数指令调优模型的量化版本，采用量化感知训练(QAT)权重生成，支持多种量化级别以适应不同硬件需求。

大型语言模型

Nvidia Llama 3 1 Nemotron Ultra 253B V1 GGUF

这是NVIDIA Llama-3_1-Nemotron-Ultra-253B-v1模型的量化版本，使用llama.cpp进行量化，支持多种量化类型，适用于不同硬件环境。

大型语言模型英语

Gemma 3 27b Tools Q5 K M GGUF

该模型是基于Gemma-3-27b-tools转换的GGUF格式版本，适用于本地推理任务。

大型语言模型

Qwen Qwen2.5 VL 32B Instruct GGUF

Qwen2.5-VL-32B-Instruct是一个32B参数规模的多模态视觉语言模型，支持图像理解和文本生成任务。

文本生成图像英语

Gemma 3 R1984 27B Q6 K GGUF

基于VIDraft/Gemma-3-R1984-27B转换的GGUF格式模型，支持多语言文本生成

大型语言模型支持多种语言

Mlabonne Gemma 3 4b It Abliterated GGUF

这是一个基于mlabonne/gemma-3-4b-it-abliterated模型的量化版本，使用llama.cpp进行imatrix量化，适用于图像文本到文本任务。

图像生成文本

Mlabonne Gemma 3 12b It Abliterated GGUF

基于mlabonne/gemma-3-12b-it-abliterated模型的量化版本，使用llama.cpp进行imatrix量化，适用于文本生成任务。

大型语言模型

Mlabonne Gemma 3 27b It Abliterated GGUF

基于Google Gemma 3B模型的量化版本，使用llama.cpp进行优化，支持多种量化级别，适用于文本生成任务。

大型语言模型

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

English 简体中文繁體中文にほんご

© 2025AIbase