中文优化

# 中文优化

Baidu ERNIE 4.5 0.3B PT GGUF

基于百度ERNIE-4.5-0.3B-PT模型的量化版本，通过llama.cpp工具进行优化，减少模型大小并提升运行效率。

大型语言模型支持多种语言

Skywork Skywork SWE 32B GGUF

Skywork-SWE-32B是一个32B参数的大语言模型，经过Llamacpp imatrix量化，可在资源受限环境下高效运行。

大型语言模型

Deepseek Ai DeepSeek R1 Distill Qwen 14B GGUF

DeepSeek-R1-Distill-Qwen-14B 是一个经过优化的14B参数规模的大语言模型，由DeepSeek AI发布，基于Qwen架构蒸馏而来，提供多种GGUF量化版本以提升性能。

大型语言模型

featherless-ai-quants

Deepseek R1 0528 Qwen3 8B AWQ 4bit

DeepSeek-R1-0528-Qwen3-8B的AWQ量化版本，适用于特定场景下的高效推理。

大型语言模型

Tngtech.deepseek R1T Chimera GGUF

DeepSeek-R1T-Chimera 是一个文本生成模型，基于 tngtech 的技术开发，专注于高效的自然语言处理任务。

大型语言模型

Qwen3 30B A3B Gptq 8bit

Qwen3 30B A3B是一个采用GPTQ方法进行8位量化处理的大语言模型，适用于高效推理场景。

大型语言模型

Smoothie Qwen3 4B

顺滑Qwen是一款轻量级的调整工具，能够平滑Qwen及类似模型中的词元概率，增强多语言的平衡生成能力。

大型语言模型

Transformers 英语

Qwen3-4B是基于Qwen3-4B-Base的GGUF格式模型，适用于文本生成任务。

大型语言模型

React Native Executorch Qwen 3

Qwen 3 是一个基于 ExecuTorch 运行时的语言模型，提供不同规模的量化与未量化版本。

大型语言模型

software-mansion

Qwen3 1.7B ONNX

Qwen3-1.7B 是阿里云推出的1.7B参数规模的开源大语言模型，基于Transformer架构，支持多种自然语言处理任务。

大型语言模型

Qwq DeepSeek R1 SkyT1 Flash Lightest 32B

这是一个基于Qwen2.5-32B的合并模型，融合了DeepSeek-R1-Distill-Qwen-32B、QwQ-32B和Sky-T1-32B-Flash的特点，旨在提升性能。

大型语言模型

PEG是一种通过渐进式学习实现稳健文本检索的模型，基于负样本的难度级别调整损失权重。

Transformers 中文

3b Zh Ft Research Release Q8 0 GGUF

本模型是基于canopylabs/3b-zh-ft-research_release转换而来的GGUF格式模型，适用于中文文本生成任务。

大型语言模型中文

GLM 4 32B 0414 EXL3

GLM-4-32B-0414是THUDM团队开发的大规模语言模型，基于GLM架构，适用于多种文本生成任务。

大型语言模型

THUDM.GLM 4 32B 0414 GGUF

GLM-4-32B-0414是由THUDM开发的大规模语言模型，具有320亿参数，适用于多种文本生成任务。

大型语言模型

Instancecap Captioner

基于Qwen2.5-VL-7B-Instruct在instancevid数据集上微调的视觉语言模型，专注于实例级图像描述生成

图像生成文本

Deepseek V3 5layer

DeepSeek-V3的5层简化开发版本，适用于轻量级任务和快速实验。

大型语言模型

Qwen2.5 14B YOYO V2

Qwen2.5-14B-YOYO-V5是基于Qwen2.5-14B基础模型，通过融合多个预训练语言模型而成的增强版本。

大型语言模型

YOYO-O1-32B是一个融合了开源社区顶尖32B推理模型与代码模型的多功能大语言模型，采用SCE融合技术构建。

大型语言模型

Gemma 3 27b Pt Q4 K M GGUF

该模型是基于Google的gemma-3-27b-pt模型通过llama.cpp转换为GGUF格式的版本，适用于本地推理任务。

大型语言模型

Qwen2.5 VL 7B Instruct GPTQ Int4

Qwen2.5-VL-7B-Instruct-GPTQ-Int4是基于Qwen2.5-VL-7B-Instruct模型进行非官方GPTQ-Int4量化的版本，支持图文到文本的多模态任务。

图像生成文本

Transformers 支持多种语言

Qwen2 VL 7B Captioner Relaxed Q4 K M GGUF

这是一个基于Qwen2-VL-7B-Captioner-Relaxed模型转换的GGUF格式模型，专门用于图像转文本任务。

图像生成文本英语

Deepseek Ai.deepseek R1 Distill Llama 8B GGUF

DeepSeek-R1-Distill-Llama-8B 是一个基于 Llama 架构的 8B 参数规模的大型语言模型，经过蒸馏训练优化，适用于文本生成任务。

大型语言模型

Llama 3.3 70B Instruct Abliterated Finetuned GPTQ Int8

这是基于Llama-3.3-70B-Instruct模型的GPTQ量化8位版本，经过微调优化，适用于对话推理任务。

大型语言模型

Transformers 支持多种语言

Moxin 7B是一款强大的开源大语言模型，提供基础模型和聊天模型等多种类型，在多个常见数据集上展现出了良好的性能。

大型语言模型

Llama 3.2 Taiwan 1B

Llama-3.2-Taiwan-1B 是一个基于 Meta 的 Llama-3.2-1B 模型的多语言文本生成模型，特别支持中文（台湾地区）及其他多种语言。

大型语言模型

Transformers 支持多种语言

GLM-Edge-V-5B是一个50亿参数的多模态模型，支持图像和文本输入，能够执行图像理解和文本生成任务。

图像生成文本

Glm Edge 1.5b Chat

GLM-Edge-1.5B-Chat 是一个基于 GLM 架构的 15 亿参数规模的聊天模型，适用于中文对话场景。

大型语言模型

Summllama3.2 3B GGUF

SummLlama3.2-3B是基于Llama3架构优化的3.2B参数摘要生成模型，提供多种量化版本以适应不同硬件需求。

大型语言模型

Skywork Critic Llama 3.1 8B

天工评判系列模型是先进的评判模型，擅长进行成对偏好评估，能够对输入的一对内容进行比较和评估，给出细致的判断。

大型语言模型

Minicpm Embedding

MiniCPM-Embedding 是基于 MiniCPM-2B-sft-bf16 基础模型开发的嵌入模型，专注于检索任务，支持中英文双语。

Transformers 支持多种语言

LinFusion是一个基于Diffusers库的文本生成图像模型，支持通过文本描述生成高质量图像。

Sl Persian Ser With Gwo And Hubert

这是一个基于Apache-2.0许可证的开源模型，具体信息需要补充

大型语言模型

通义千问Qwen2系列的大语言模型，包含多个参数规模的模型，从5亿到720亿参数，支持指令调优。

大型语言模型

这是一个基于Apache-2.0许可证发布的模型，具体信息暂不可知。

大型语言模型

Qwen2 7B Int4 Inc

基于Qwen2-7B的INT4自动量化模型，由英特尔auto-round工具生成，适用于高效推理任务

大型语言模型

Yi-1.5是Yi模型的升级版本，在编程、数学、推理和指令遵循能力方面表现更出色，同时保持了优秀的语言理解、常识推理和阅读理解能力。

大型语言模型

Llava Llama 3 8b V1 1 GGUF

基于Meta-Llama-3-8B-Instruct和CLIP-ViT-Large-patch14-336微调的LLaVA模型，支持图像转文本任务

图像生成文本

Llava Llama 3 8b V1 1 Gguf

基于Meta-Llama-3-8B-Instruct和CLIP-ViT-Large-patch14-336模型微调的多模态模型，支持图像理解和文本生成

图像生成文本

Llava Llama 3 8b V1 1 Q5 K M GGUF

该模型是基于xtuner/llava-llama-3-8b-v1_1转换的GGUF格式版本，适用于llama.cpp框架，支持图像文本到文本的转换任务。

图像生成文本

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

English 简体中文繁體中文にほんご

© 2025AIbase