多量化版本

# 多量化版本

Longwriter Zero 32B I1 GGUF

LongWriter-Zero-32B 量化模型基于 THU-KEG/LongWriter-Zero-32B 基础模型，支持中英双语，适用于强化学习、写作等长上下文场景。

大型语言模型

Transformers 支持多种语言

ICONNAI ICONN 1 GGUF

ICONN-1的量化版本，提供多种量化选项以适应不同性能和质量需求

大型语言模型

Mass Academy Faq Embedder I1 GGUF

本模型是ntproctor/mass-academy-faq-embedder的量化版本，提供多种量化类型选择，适用于高效的特征提取和句子相似度计算。

Transformers 英语

Qwen2 Audio 7B Instruct GGUF

Qwen2-Audio-7B-Instruct模型的静态量化版本，支持英文音频文本转文本任务

音频生成文本

Transformers 英语

Facebook KernelLLM GGUF

KernelLLM是Facebook开发的大语言模型，此版本为使用llama.cpp工具进行imatrix量化的版本，提供多种量化选项以适应不同硬件需求。

大型语言模型

Wan2.1 14B VACE GGUF

Wan2.1-VACE-14B模型的GGUF格式版本，主要用于文本到视频的生成任务。

文本生成视频

Thedrummer Snowpiercer 15B V1 GGUF

基于TheDrummer/Snowpiercer-15B-v1模型的量化版本，使用llama.cpp进行量化，适用于文本生成任务。

大型语言模型

Mlabonne Qwen3 1.7B Abliterated GGUF

这是一个基于Qwen3-1.7B-abliterated模型的量化版本，使用llama.cpp进行量化，支持多种量化类型，适用于文本生成任务。

大型语言模型

Josiefied Qwen3 4B Abliterated V1 Gguf

这是 Josiefied-Qwen3-4B-abliterated-v1 模型的 GGUF 量化版本，适用于本地部署和运行。

大型语言模型

Goekdeniz-Guelmez

Inclusionai Ling Lite 0415 GGUF

基于inclusionAI/Ling-lite的量化版本，使用llama.cpp进行imatrix量化，支持多种量化类型以适应不同硬件需求。

大型语言模型

Deepcoder 14B Preview Exl2

DeepCoder-14B-Preview是基于DeepSeek-R1-Distill-Qwen-14B开发的代码生成模型，专注于可验证编程问题的解决。

大型语言模型英语

Beaver 7b V3.0 GGUF

Beaver-7B-v3.0 是一个基于 LLaMA 架构的 7B 参数大语言模型，专注于安全性和人类反馈强化学习（RLHF）。

大型语言模型英语

Orpheus Bangla GGUF

这是asif00/orpheus-bangla-tts模型的静态量化版本，支持孟加拉语文本转语音任务。

语音合成其他

Lightblue Reranker 0.5 Bincont Filt Gguf

这是一个文本排序模型，用于对文本进行相关性排序。

Lightblue Reranker 0.5 Cont Gguf

这是一个文本排序模型，用于对文本进行重新排序和评分。

Jbaron34 Qwen2.5 0.5b Bebop Reranker Newer Small Gguf

基于Qwen2.5架构的0.5亿参数文本排序模型，适用于信息检索和文档排序任务

大型语言模型

Jbaron34 Qwen2.5 0.5b Bebop Reranker New Small Gguf

基于Qwen2.5架构的0.5B参数规模的文本排序模型，适用于重排序任务。

大型语言模型

腾讯混元社区开发的图像转视频模型，能够将输入的文本描述转换为动态视频内容。

视频处理英语

Pllum 8x7B Chat GGUF

PLLuM-8x7B-chat的GGUF量化版本，针对本地推理优化，支持多种量化级别以适应不同硬件需求。

大型语言模型

piotrmaciejbednarski

Gte Qwen2 7B Instruct GGUF

阿里巴巴NLP团队开发的7B参数规模的多语言文本嵌入模型，专注于句子相似度任务，提供多种量化版本

大型语言模型英语

Heackmt5 ZhSum100k GGUF

基于mT5架构的中文摘要生成模型，提供多种量化版本

文本生成中文

Greek Text Summarization GGUF

基于kriton/greek-text-summarization的静态量化版本，专注于希腊语文本摘要任务

文本生成其他

Deepthink Reasoning 7B GGUF

Deepthink-Reasoning-7B的Llamacpp imatrix量化版本，提供多种量化类型选择以适应不同硬件需求

大型语言模型英语

Smolmaestra 1.7b Translation GGUF

SmolMaestra-1.7b-Translation是一个1.7B参数的翻译模型，支持英语和意大利语之间的翻译任务。

机器翻译支持多种语言

Aura-4B是一个基于AuraIndustries/Aura-4B的量化版本，使用llama.cpp进行imatrix量化，支持多种量化类型，适用于文本生成任务。

大型语言模型英语

Aion RP Llama 3.1 8B GGUF

Aion-RP-Llama-3.1-8B的Llamacpp imatrix量化版本，提供多种量化选项以适应不同硬件需求。

大型语言模型

FLUX.1 Canny Dev GGUF

FLUX.1-Canny-dev 是一个基于文本生成图像的模型，专注于图像生成任务。

文本生成图像英语

Stable Diffusion 3.5 Medium GGUF

Stable Diffusion 3.5 Medium 的 GGUF 量化版本，支持文本到图像生成任务。

文本生成图像英语

Llama Mesh GGUF

LLaMA-Mesh是一个基于LLaMA架构的文本转3D模型，专注于网格生成任务。该版本是使用llama.cpp进行量化的版本，提供了多种量化选项以适应不同硬件需求。

文本生成图像

Stable Diffusion 3.5 Large GGUF

Stable Diffusion 3.5 Large 是一个强大的文本生成图像模型，基于扩散模型架构，能够根据文本描述生成高质量的图像。

文本生成图像英语

Qwen2.5 Coder 1.5B GGUF

Qwen2.5-Coder-1.5B 是一个1.5B参数的代码生成模型，支持多种编程语言，适用于代码补全和生成任务。

大型语言模型

Transformers 支持多种语言

LLAMA 3 8B Unaligned BETA GGUF

基于LLaMA-3架构的8B参数未对齐测试版模型，提供多种量化版本以适应不同硬件需求

大型语言模型

FLUX.1 Dev GGUF

FLUX.1-dev 是一个文本生成图像的扩散模型，由 black-forest-labs 开发，支持通过文本提示生成高质量图像。

文本生成图像英语

Thusinh1969 Gemma2 2b Rerank Checkpoint 8800 Gguf

基于Gemma 2B架构的文本排序模型，提供多种量化版本以适应不同硬件需求

Chewy Lemon Cookie 11B GGUF

Chewy-Lemon-Cookie-11B 是一个基于 Mistral 架构的 11B 参数大语言模型，专注于文本生成和角色扮演任务。

大型语言模型英语

Wizardlm 2 7B Abliterated GGUF

WizardLM-2-7B-abliterated的Llamacpp imatrix量化版本，提供多种量化选项，适用于不同硬件配置。

大型语言模型

Mistral 7B Instruct V0.3 GGUF

Mistral-7B-Instruct-v0.3 是基于 Mistral-7B-v0.3 进行指令微调的大型语言模型，支持函数调用和扩展词汇表。

大型语言模型

Phi 3 Mini 128k Instruct Function GGUF

Phi-3-mini-128k-instruct_function 是一个基于 GGUF 格式量化的文本生成模型，支持多种量化级别。

大型语言模型

Orcamaid V3 13B 32k GGUF

Orcamaid v3 13B 32K 是一个基于 Llama 架构的大语言模型，支持 32K 序列长度，适用于文本生成任务。

大型语言模型

Law LLM 13B GGUF

Law LLM 13B是基于LLaMA-1-13B开发的特定领域基础模型，专注于法律领域的任务。

大型语言模型

Transformers 英语

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

English 简体中文繁體中文にほんご

© 2025AIbase