# 超长上下文

Qwen3 30B A3B AWQ
Apache-2.0
Qwen3-30B-A3B-AWQ 是基于 Qwen3-30B-A3B 模型的 AWQ 量化版本,适用于文本生成任务,支持思维模式和非思维模式切换。
大型语言模型 Transformers
Q
cognitivecomputations
14.45k
12
Qwen3 14B AWQ
Apache-2.0
Qwen3-14B-AWQ是通义千问系列最新一代大语言模型的4-bit AWQ量化版本,支持思维模式与非思维模式无缝切换,具备强大的推理、指令遵循和智能体能力。
大型语言模型 Transformers
Q
Qwen
15.17k
21
Qwen3 235B A22B INT4MIX
Apache-2.0
Qwen3-235B-A22B是通义大模型系列的最新一代产品,提供了一系列密集和混合专家(MoE)模型,在推理、指令遵循、智能体能力和多语言支持方面取得了突破性进展。
大型语言模型 Transformers
Q
fastllm
144
2
Qwen3 30B A3B 128K GGUF
Apache-2.0
Qwen3是通义千问系列最新一代大语言模型,提供完整的稠密与混合专家(MoE)模型体系。基于海量训练,Qwen3在推理、指令跟随、智能体能力和多语言支持方面实现突破性进展。
大型语言模型 英语
Q
unsloth
48.68k
43
Qwen3 4B GGUF
Qwen3-4B是由Qwen开发的大语言模型,支持131,072 tokens的上下文长度,擅长创意写作、角色扮演和多轮对话。
大型语言模型
Q
lmstudio-community
26.16k
8
Qwen3 235B A22B GGUF
Apache-2.0
Qwen3是Qwen系列最新一代的大语言模型,提供了一系列密集和混合专家(MoE)模型。基于广泛的训练,Qwen3在推理、指令遵循、代理能力和多语言支持方面实现了突破性进展。
大型语言模型 英语
Q
unsloth
75.02k
48
Qwen3 30B A3B
Apache-2.0
Qwen3是通义千问系列大语言模型的最新版本,提供完整的稠密模型与混合专家(MoE)模型组合。基于大规模训练,Qwen3在推理能力、指令遵循、智能体功能和多语言支持方面实现突破性进展。
大型语言模型 Transformers
Q
Qwen
218.81k
571
Llama 4 Maverick 17B 128E Instruct
其他
Llama 4 Maverick是Meta推出的170亿参数多模态AI模型,采用混合专家架构(MoE),支持多语言文本和图像理解,具备128个专家模块。
大型语言模型 Transformers 支持多种语言
L
meta-llama
87.79k
309
Qwen2 VL 72B Instruct GGUF
其他
Qwen2-VL-72B-Instruct-GGUF 是原模型经过量化处理后的版本,支持多模态任务,可通过 GaiaNet 运行。
图像生成文本 Transformers 英语
Q
gaianet
1,803
0
Sambalingo Japanese Chat
基于Llama2架构的多语言对话模型,支持日语和英语,训练数据包含ultrachat、ultrafeedback和harmless对话数据集
大型语言模型 Transformers 支持多种语言
S
sambanovasystems
32
34
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase