# 中文优化

Baidu ERNIE 4.5 0.3B PT GGUF
Apache-2.0
基于百度ERNIE-4.5-0.3B-PT模型的量化版本,通过llama.cpp工具进行优化,减少模型大小并提升运行效率。
大型语言模型 支持多种语言
B
bartowski
314
3
Skywork Skywork SWE 32B GGUF
Apache-2.0
Skywork-SWE-32B是一个32B参数的大语言模型,经过Llamacpp imatrix量化,可在资源受限环境下高效运行。
大型语言模型
S
bartowski
921
2
Deepseek Ai DeepSeek R1 Distill Qwen 14B GGUF
DeepSeek-R1-Distill-Qwen-14B 是一个经过优化的14B参数规模的大语言模型,由DeepSeek AI发布,基于Qwen架构蒸馏而来,提供多种GGUF量化版本以提升性能。
大型语言模型
D
featherless-ai-quants
237
1
Deepseek R1 0528 Qwen3 8B AWQ 4bit
MIT
DeepSeek-R1-0528-Qwen3-8B的AWQ量化版本,适用于特定场景下的高效推理。
大型语言模型 Transformers
D
hxac
179
2
Tngtech.deepseek R1T Chimera GGUF
DeepSeek-R1T-Chimera 是一个文本生成模型,基于 tngtech 的技术开发,专注于高效的自然语言处理任务。
大型语言模型
T
DevQuasar
1,407
2
Qwen3 30B A3B Gptq 8bit
Apache-2.0
Qwen3 30B A3B是一个采用GPTQ方法进行8位量化处理的大语言模型,适用于高效推理场景。
大型语言模型 Transformers
Q
btbtyler09
301
2
Smoothie Qwen3 4B
Apache-2.0
顺滑Qwen是一款轻量级的调整工具,能够平滑Qwen及类似模型中的词元概率,增强多语言的平衡生成能力。
大型语言模型 Transformers 英语
S
dnotitia
2,189
2
Qwen3 4B GGUF
Apache-2.0
Qwen3-4B是基于Qwen3-4B-Base的GGUF格式模型,适用于文本生成任务。
大型语言模型
Q
Mungert
1,507
7
React Native Executorch Qwen 3
Apache-2.0
Qwen 3 是一个基于 ExecuTorch 运行时的语言模型,提供不同规模的量化与未量化版本。
大型语言模型
R
software-mansion
732
1
Qwen3 1.7B ONNX
Qwen3-1.7B 是阿里云推出的1.7B参数规模的开源大语言模型,基于Transformer架构,支持多种自然语言处理任务。
大型语言模型 Transformers
Q
onnx-community
189
1
Qwq DeepSeek R1 SkyT1 Flash Lightest 32B
这是一个基于Qwen2.5-32B的合并模型,融合了DeepSeek-R1-Distill-Qwen-32B、QwQ-32B和Sky-T1-32B-Flash的特点,旨在提升性能。
大型语言模型 Transformers
Q
sm54
14
4
PEG
PEG是一种通过渐进式学习实现稳健文本检索的模型,基于负样本的难度级别调整损失权重。
文本嵌入 Transformers 中文
P
TownsWu
36
29
3b Zh Ft Research Release Q8 0 GGUF
Apache-2.0
本模型是基于canopylabs/3b-zh-ft-research_release转换而来的GGUF格式模型,适用于中文文本生成任务。
大型语言模型 中文
3
cludyw
20
0
GLM 4 32B 0414 EXL3
Apache-2.0
GLM-4-32B-0414是THUDM团队开发的大规模语言模型,基于GLM架构,适用于多种文本生成任务。
大型语言模型
G
owentruong
36
2
THUDM.GLM 4 32B 0414 GGUF
GLM-4-32B-0414是由THUDM开发的大规模语言模型,具有320亿参数,适用于多种文本生成任务。
大型语言模型
T
DevQuasar
13.15k
5
Instancecap Captioner
其他
基于Qwen2.5-VL-7B-Instruct在instancevid数据集上微调的视觉语言模型,专注于实例级图像描述生成
图像生成文本 Transformers
I
AnonMegumi
14
1
Deepseek V3 5layer
DeepSeek-V3的5层简化开发版本,适用于轻量级任务和快速实验。
大型语言模型 Transformers
D
chwan
30.01k
1
Qwen2.5 14B YOYO V2
Qwen2.5-14B-YOYO-V5是基于Qwen2.5-14B基础模型,通过融合多个预训练语言模型而成的增强版本。
大型语言模型 Transformers
Q
YOYO-AI
14
2
YOYO O1 32B
YOYO-O1-32B是一个融合了开源社区顶尖32B推理模型与代码模型的多功能大语言模型,采用SCE融合技术构建。
大型语言模型 Transformers
Y
YOYO-AI
25
2
Gemma 3 27b Pt Q4 K M GGUF
该模型是基于Google的gemma-3-27b-pt模型通过llama.cpp转换为GGUF格式的版本,适用于本地推理任务。
大型语言模型
G
deltanym
30
1
Qwen2.5 VL 7B Instruct GPTQ Int4
Apache-2.0
Qwen2.5-VL-7B-Instruct-GPTQ-Int4是基于Qwen2.5-VL-7B-Instruct模型进行非官方GPTQ-Int4量化的版本,支持图文到文本的多模态任务。
图像生成文本 Transformers 支持多种语言
Q
hfl
872
3
Qwen2 VL 7B Captioner Relaxed Q4 K M GGUF
Apache-2.0
这是一个基于Qwen2-VL-7B-Captioner-Relaxed模型转换的GGUF格式模型,专门用于图像转文本任务。
图像生成文本 英语
Q
alecccdd
88
1
Deepseek Ai.deepseek R1 Distill Llama 8B GGUF
DeepSeek-R1-Distill-Llama-8B 是一个基于 Llama 架构的 8B 参数规模的大型语言模型,经过蒸馏训练优化,适用于文本生成任务。
大型语言模型
D
DevQuasar
320
3
Llama 3.3 70B Instruct Abliterated Finetuned GPTQ Int8
这是基于Llama-3.3-70B-Instruct模型的GPTQ量化8位版本,经过微调优化,适用于对话推理任务。
大型语言模型 Transformers 支持多种语言
L
huihui-ai
7,694
12
Moxin 7B LLM
Apache-2.0
Moxin 7B是一款强大的开源大语言模型,提供基础模型和聊天模型等多种类型,在多个常见数据集上展现出了良好的性能。
大型语言模型 Transformers
M
moxin-org
134
17
Llama 3.2 Taiwan 1B
Llama-3.2-Taiwan-1B 是一个基于 Meta 的 Llama-3.2-1B 模型的多语言文本生成模型,特别支持中文(台湾地区)及其他多种语言。
大型语言模型 Transformers 支持多种语言
L
lianghsun
47
4
Glm Edge V 5b
其他
GLM-Edge-V-5B是一个50亿参数的多模态模型,支持图像和文本输入,能够执行图像理解和文本生成任务。
图像生成文本
G
THUDM
4,357
12
Glm Edge 1.5b Chat
其他
GLM-Edge-1.5B-Chat 是一个基于 GLM 架构的 15 亿参数规模的聊天模型,适用于中文对话场景。
大型语言模型 Safetensors
G
THUDM
891
17
Summllama3.2 3B GGUF
SummLlama3.2-3B是基于Llama3架构优化的3.2B参数摘要生成模型,提供多种量化版本以适应不同硬件需求。
大型语言模型
S
tensorblock
95
1
Skywork Critic Llama 3.1 8B
其他
天工评判系列模型是先进的评判模型,擅长进行成对偏好评估,能够对输入的一对内容进行比较和评估,给出细致的判断。
大型语言模型 PyTorch
S
Skywork
1,376
12
Minicpm Embedding
MiniCPM-Embedding 是基于 MiniCPM-2B-sft-bf16 基础模型开发的嵌入模型,专注于检索任务,支持中英文双语。
文本嵌入 Transformers 支持多种语言
M
openbmb
315
245
Linfusion 1 5
LinFusion是一个基于Diffusers库的文本生成图像模型,支持通过文本描述生成高质量图像。
图像生成
L
Yuanshi
37
15
Sl Persian Ser With Gwo And Hubert
Apache-2.0
这是一个基于Apache-2.0许可证的开源模型,具体信息需要补充
大型语言模型 Transformers
S
amirahmadian16
20
0
Qwen2
其他
通义千问Qwen2系列的大语言模型,包含多个参数规模的模型,从5亿到720亿参数,支持指令调优。
大型语言模型
Q
cortexso
132
1
Emotion LLaMA
Apache-2.0
这是一个基于Apache-2.0许可证发布的模型,具体信息暂不可知。
大型语言模型 Transformers
E
ZebangCheng
213
4
Qwen2 7B Int4 Inc
Apache-2.0
基于Qwen2-7B的INT4自动量化模型,由英特尔auto-round工具生成,适用于高效推理任务
大型语言模型 Transformers
Q
Intel
48
6
Yi 1.5 9B
Apache-2.0
Yi-1.5是Yi模型的升级版本,在编程、数学、推理和指令遵循能力方面表现更出色,同时保持了优秀的语言理解、常识推理和阅读理解能力。
大型语言模型 Transformers
Y
01-ai
6,140
48
Llava Llama 3 8b V1 1 GGUF
基于Meta-Llama-3-8B-Instruct和CLIP-ViT-Large-patch14-336微调的LLaVA模型,支持图像转文本任务
图像生成文本
L
MoMonir
138
5
Llava Llama 3 8b V1 1 Gguf
基于Meta-Llama-3-8B-Instruct和CLIP-ViT-Large-patch14-336模型微调的多模态模型,支持图像理解和文本生成
图像生成文本
L
xtuner
9,484
216
Llava Llama 3 8b V1 1 Q5 K M GGUF
该模型是基于xtuner/llava-llama-3-8b-v1_1转换的GGUF格式版本,适用于llama.cpp框架,支持图像文本到文本的转换任务。
图像生成文本
L
djward888
20
2
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase