Qwen3 30B A3B AWQ
Apache-2.0
Qwen3-30B-A3B-AWQ 是基于 Qwen3-30B-A3B 模型的 AWQ 量化版本,适用于文本生成任务,支持思维模式和非思维模式切换。
大型语言模型
Transformers

Q
cognitivecomputations
14.45k
12
Qwen3 14B AWQ
Apache-2.0
Qwen3-14B-AWQ是通义千问系列最新一代大语言模型的4-bit AWQ量化版本,支持思维模式与非思维模式无缝切换,具备强大的推理、指令遵循和智能体能力。
大型语言模型
Transformers

Q
Qwen
15.17k
21
Qwen3 235B A22B INT4MIX
Apache-2.0
Qwen3-235B-A22B是通义大模型系列的最新一代产品,提供了一系列密集和混合专家(MoE)模型,在推理、指令遵循、智能体能力和多语言支持方面取得了突破性进展。
大型语言模型
Transformers

Q
fastllm
144
2
Qwen3 30B A3B 128K GGUF
Apache-2.0
Qwen3是通义千问系列最新一代大语言模型,提供完整的稠密与混合专家(MoE)模型体系。基于海量训练,Qwen3在推理、指令跟随、智能体能力和多语言支持方面实现突破性进展。
大型语言模型 英语
Q
unsloth
48.68k
43
Qwen3 4B GGUF
Qwen3-4B是由Qwen开发的大语言模型,支持131,072 tokens的上下文长度,擅长创意写作、角色扮演和多轮对话。
大型语言模型
Q
lmstudio-community
26.16k
8
Qwen3 235B A22B GGUF
Apache-2.0
Qwen3是Qwen系列最新一代的大语言模型,提供了一系列密集和混合专家(MoE)模型。基于广泛的训练,Qwen3在推理、指令遵循、代理能力和多语言支持方面实现了突破性进展。
大型语言模型 英语
Q
unsloth
75.02k
48
Qwen3 30B A3B
Apache-2.0
Qwen3是通义千问系列大语言模型的最新版本,提供完整的稠密模型与混合专家(MoE)模型组合。基于大规模训练,Qwen3在推理能力、指令遵循、智能体功能和多语言支持方面实现突破性进展。
大型语言模型
Transformers

Q
Qwen
218.81k
571
Llama 4 Maverick 17B 128E Instruct
其他
Llama 4 Maverick是Meta推出的170亿参数多模态AI模型,采用混合专家架构(MoE),支持多语言文本和图像理解,具备128个专家模块。
大型语言模型
Transformers 支持多种语言

L
meta-llama
87.79k
309
Qwen2 VL 72B Instruct GGUF
其他
Qwen2-VL-72B-Instruct-GGUF 是原模型经过量化处理后的版本,支持多模态任务,可通过 GaiaNet 运行。
图像生成文本
Transformers 英语

Q
gaianet
1,803
0
Sambalingo Japanese Chat
基于Llama2架构的多语言对话模型,支持日语和英语,训练数据包含ultrachat、ultrafeedback和harmless对话数据集
大型语言模型
Transformers 支持多种语言

S
sambanovasystems
32
34
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers 支持多种语言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers 英语

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统 中文
R
uer
2,694
98