Openbuddy OpenBuddy R1 0528 Distill Qwen3 32B Preview0 QAT GGUF
Apache-2.0
这是OpenBuddy-R1-0528-Distill-Qwen3-32B-Preview0-QAT的量化版本,借助量化技术可以在不同硬件条件下更高效地运行模型。
大型语言模型 支持多种语言
O
bartowski
720
1
Fastwebmiia 7B
其他
FastwebMIIA是由Fastweb开发的70亿参数意大利人工智能模型,专为意大利语和英语设计,支持长文档处理。
大型语言模型
Transformers

F
Fastweb
124
2
Qwen3 4B Llamafile
Apache-2.0
Qwen3-4B是Qwen系列最新一代的大语言模型,具有4B参数规模,支持128k上下文窗口和100多种语言,在推理、指令遵循和代理能力方面表现优异。
大型语言模型
Q
Mozilla
995
2
Qwen3 1.7B Q8 0 GGUF
Apache-2.0
Qwen3-1.7B-Q8_0-GGUF是基于Qwen/Qwen3-1.7B转换的GGUF格式模型,支持文本生成任务,具备多语言支持和高效的推理能力。
大型语言模型
Q
Triangle104
277
1
HMS Slerp 12B V2
这是一个通过SLERP方法融合的12B参数规模的多语言大语言模型,支持英文和日文处理。
大型语言模型
Transformers 支持多种语言

H
yamatazen
16
2
Jungzoona T3Q Qwen2.5 14b V1.0 E3 GGUF
Apache-2.0
本仓库包含JungZoona/T3Q-qwen2.5-14b-v1.0-e3的GGUF格式模型文件,由TensorBlock提供的机器进行量化,兼容llama.cpp。
大型语言模型
Transformers 支持多种语言

J
tensorblock
557
1
Minicpm S 1B Sft
Apache-2.0
MiniCPM-S-1B-sft 是一个基于激活稀疏化技术优化的1B参数规模语言模型,通过ProSparse方法实现高稀疏性推理加速,同时保持与原始模型相当的性能。
大型语言模型
Transformers 支持多种语言

M
openbmb
169
10
Qwen2.5 1.5B Instruct GGUF
Apache-2.0
Qwen2.5是Qwen大语言模型的最新系列,1.5B参数规模的指令调优模型,支持多语言和长文本生成。
大型语言模型 英语
Q
Mungert
556
4
Kyro N1.1 7B Pytorch
其他
Kyro-n1.1是Kyro-n1的增强版本,基于Qwen2.5-7B-Instruct构建,优化了推理能力、理解能力和响应精准度。
大型语言模型
Transformers 支持多种语言

K
open-neo
41
2
Llama 3.1 8B Instruct GGUF
Meta Llama 3.1系列是多语言大语言模型(LLMs)的集合,包括8B、70B和405B大小的预训练和指令调优生成模型。8B版本针对多语言对话用例进行了优化,在常见基准测试中表现优异。
大型语言模型 支持多种语言
L
unsloth
4,071
6
Elastic Qwen2.5 7B Instruct
Apache-2.0
弹性模型是由TheStage AI ANNA生成的模型系列,通过滑动控制条可自由调节模型规模、延迟与质量,为自托管场景提供最快最灵活的解决方案。
大型语言模型 支持多种语言
E
TheStageAI
30
2
HMS Slerp 12B
HMS-Slerp-12B 是一个采用SLERP球面线性插值法合并的多语言聊天模型,支持英语和日语。
大型语言模型
Transformers 支持多种语言

H
yamatazen
41
2
Elvenmaid 12B Stock
基于ElvenMaid-12B系列模型合并的ChatML格式语言模型,支持英文和日文
大型语言模型
Transformers 支持多种语言

E
yamatazen
35
2
Phi 4 Mini Instruct Float8dq
MIT
Phi-4-mini-instruct模型经torchao进行float8动态激活和权重量化,在H100上实现36%显存降低和15-20%速度提升,几乎不影响精度。
大型语言模型
Transformers 其他

P
pytorch
1,006
1
Elvenmaid 12B
ElvenMaid-12B 是一个基于 ChatML 格式的 12B 参数语言模型,通过 mergekit 工具合并多个预训练模型而成,支持英文和日文交互。
大型语言模型
Transformers 支持多种语言

E
yamatazen
38
2
Himeyuri Magnum 12B
Himeyuri-Magnum-12B 是一个基于 ChatML 格式的多语言预训练语言模型,通过 mergekit 工具合并多个 12B 参数规模的模型而成。
大型语言模型
Transformers 支持多种语言

H
yamatazen
22
2
Fibonacci 2 14B
MIT
基于Phi 4架构的大型语言模型,拥有140亿参数,针对自然语言处理和文本对话任务进行了优化。
大型语言模型 支持多种语言
F
fibonacciai
97
13
Trillion 7B Preview AWQ
Apache-2.0
Trillion-7B预览版是一款多语言大语言模型,支持英语、韩语、日语和中文,在计算效率和性能表现上优于同类7B规模模型。
大型语言模型 支持多种语言
T
trillionlabs
22
4
Trillion 7B Preview
Apache-2.0
Trillion-7B预览版是一款多语言大型语言模型,支持英语、韩语、日语和中文,在保持较低计算量的同时实现了与更高计算量模型竞争的性能。
大型语言模型
Transformers 支持多种语言

T
trillionlabs
6,864
82
Etherealaurora 12B V2
基于ChatML架构的对话模型,通过mergekit工具合并预训练语言模型生成
大型语言模型
Transformers 支持多种语言

E
yamatazen
859
16
Kyro N1.1 7B
其他
Kyro-n1.1是Kyro-n1的增强版本,基于Qwen2.5-7B-Instruct构建,优化了推理能力、理解力和响应精准度。
大型语言模型
Transformers 支持多种语言

K
open-neo
470
4
Bloomvn 8B Chat Reasoning
MIT
专为越南语推理优化的多语言微调模型,具备分步推理能力,采用结构化XML格式
大型语言模型
Transformers 支持多种语言

B
BlossomsAI
68
2
Aurora SCE 12B
基于SCE方法合并的多语言ChatML模型,支持英文和日文对话
大型语言模型
Transformers 支持多种语言

A
yamatazen
51
6
Fibonacci 1 EN 8b Chat.p1 5
MIT
Fibonacci-1-EN-8b-Chat.P1_5是基于LLaMA架构的大型语言模型,具有80.3亿参数,针对自然语言处理任务和文本对话进行了优化。
大型语言模型 支持多种语言
F
fibonacciai
132
11
Ozone Ai 0x Lite GGUF
Apache-2.0
基于ozone-ai/0x-lite模型的量化版本,支持中英文文本生成任务,采用llama.cpp进行imatrix量化,提供多种量化选项以适应不同硬件需求。
大型语言模型 支持多种语言
O
bartowski
220
2
Llama 3.3 70B Instruct Quantized.w8a8
这是Llama-3.3-70B-Instruct的量化版本模型,支持多语言文本生成,可用于商业和研究场景,在多个基准测试中表现出色。
大型语言模型
Safetensors 支持多种语言
L
RedHatAI
19.02k
7
Razorback 12B V0.2
其他
Razorback 12B v0.2 是一个结合了Pixtral 12B和UnslopNemo v3优势的多模态模型,具备视觉理解和语言处理能力。
图像生成文本
Transformers 支持多种语言

R
nintwentydo
17
3
Openbuddy Deepseek 10b V17.1 4k GGUF
其他
OpenBuddy/openbuddy-deepseek-10b-v17.1-4k的GGUF格式模型文件,支持多种语言,适用于文本生成任务。
大型语言模型 支持多种语言
O
tensorblock
81
1
Meta Llama 3.3 70B Instruct AWQ INT4
Llama 3.3 70B Instruct AWQ INT4 是 Meta Llama 3.3 70B Instruct 模型的 4 位量化版本,适用于多语言对话用例,优化了文本生成任务。
大型语言模型
Transformers 支持多种语言

M
ibnzterrell
6,410
22
Llama 3.2 3B Instruct QLORA INT4 EO8
Llama 3.2是Meta推出的多语言大语言模型,提供1B和3B两种参数规模,支持多种语言任务,性能优于现有开源和闭源模型。
大型语言模型
PyTorch 支持多种语言
L
meta-llama
289
68
Glm 4 9b Chat Hf
其他
GLM-4-9B是智谱AI推出的GLM-4系列最新一代预训练模型的开源版本,具备卓越的语义、数学、推理、代码和知识能力。
大型语言模型
Transformers 支持多种语言

G
THUDM
7,919
13
Qwen2.5 32B AGI
Apache-2.0
首个Qwen2.5 32B微调版本,旨在修复其过度审查炎症问题,支持多语言交互。
大型语言模型
Transformers 支持多种语言

Q
AiCloser
163
87
Vapor V2 7B
Apache-2.0
基于Qwen/Qwen2.5-7B模型在多语言数据集上微调的大语言模型,支持13种语言处理
大型语言模型
Transformers

V
FourOhFour
60
4
Llama VARCO 8B Instruct
Llama-VARCO-8B-Instruct是一个基于Llama构建的生成式模型,通过额外的训练,在韩语处理方面表现出色,同时保持英语能力。
大型语言模型
Transformers 支持多种语言

L
NCSOFT
2,981
74
Llama 3.1 8B Instruct GGUF
Meta Llama 3.1 8B Instruct 是一个多语言大语言模型,针对多语言对话用例进行了优化,在常见的行业基准测试中表现优异。
大型语言模型 英语
L
modularai
9.7M
4
Internlm2 5 20b Chat Abliterated
Apache-2.0
这是一个基于internlm2_5-20b-chat模型进行消融处理的版本,使用CPU进行消融处理的新方法。
大型语言模型
Transformers 支持多种语言

I
byroneverson
16
4
Magnum V2 72b
其他
该模型是基于Qwen-2 72B Instruct微调的大语言模型,旨在复制Claude 3系列模型的散文质量,是系列模型中的第七个版本。
大型语言模型
Safetensors 支持多种语言
M
anthracite-org
302
39
Meta Llama 3.1 8B Instruct GPTQ INT4
这是Meta-Llama-3.1-8B-Instruct模型的INT4量化版本,使用GPTQ算法进行量化,适用于多语言对话场景。
大型语言模型
Transformers 支持多种语言

M
hugging-quants
128.18k
25
Meta Llama 3.1 8B Instruct GGUF
Meta Llama 3.1 8B 指令调优模型的 GGUF 量化版本,适用于多语言对话场景
大型语言模型 支持多种语言
M
MaziyarPanahi
499.87k
19
Meta Llama 3.1 70B Instruct AWQ INT4
Llama 3.1 70B Instruct的INT4量化版本,基于AutoAWQ技术优化,适用于多语言对话场景。
大型语言模型
Transformers 支持多种语言

M
hugging-quants
80.59k
100
- 1
- 2
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers 支持多种语言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers 英语

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统 中文
R
uer
2,694
98