Skywork SWE 32B GGUF
Apache-2.0
Skywork SWE 32B是一款专为软件工程(SWE)任务设计的代码代理模型,能有效提升相关任务的处理效率和准确性。
大型语言模型
S
lmstudio-community
311
1
Opencodereasoning Nemotron 32B IOI GGUF
Apache-2.0
基于Qwen2.5-32B-Instruct的大语言模型,专为代码生成推理而进行了后训练,支持32K上下文长度,适用于商业和非商业用途。
大型语言模型
Transformers

O
Mungert
1,317
2
Seed Coder 8B Instruct GGUF
MIT
Seed-Coder-8B-Instruct 是一款强大的开源代码模型,具有以模型为中心、透明和高性能等特点,在多种编码任务中表现出色。
大型语言模型
Transformers

S
unsloth
3,391
1
Qwen3 1.7B GGUF
Apache-2.0
Qwen3是通义千问系列大语言模型的最新代际,提供稠密和混合专家(MoE)模型的全面套件。基于大规模训练,Qwen3在推理、指令遵循、智能体能力和多语言支持方面实现了突破性进展。
大型语言模型
Q
QuantFactory
333
1
Opencodereasoning Nemotron 14B GGUF
Apache-2.0
OpenCodeReasoning-Nemotron-14B 是基于 Qwen2.5-14B-Instruct 进行后训练的大型语言模型,专为代码生成推理优化,支持32K tokens上下文长度。
大型语言模型 支持多种语言
O
Mungert
507
1
Opencodereasoning Nemotron 32B GGUF
Apache-2.0
OpenCodeReasoning-Nemotron-32B 是基于 Qwen2.5-32B-Instruct 的代码生成推理模型,支持32K tokens上下文长度,适用于商业和非商业用途。
大型语言模型 支持多种语言
O
Mungert
633
1
Opencodereasoning Nemotron 32B IOI
Apache-2.0
OpenCodeReasoning-Nemotron-32B-IOI 是一个基于 Qwen2.5-32B-Instruct 的大型语言模型,专门针对代码生成任务进行了推理后训练,支持 32K token 的上下文长度。
大型语言模型
Transformers 支持多种语言

O
nvidia
152
20
Qwen3 0.6B FP8
Apache-2.0
Qwen3-0.6B-FP8是通义千问系列大语言模型的最新版本,提供0.6B参数的FP8量化版本,支持思维模式自由切换和多种语言任务。
大型语言模型
Transformers

Q
Qwen
5,576
43
Seed Coder 8B Base
MIT
Seed-Coder是一个8B规模的开源代码模型家族,包含基础版、指令版和推理版,专注于代码生成和补全任务。
大型语言模型
Transformers

S
ByteDance-Seed
1,837
41
Qwen3 1.7B
Apache-2.0
Qwen3是通义千问系列最新一代大语言模型,提供完整的密集模型和专家混合(MoE)模型组合。基于大规模训练,Qwen3在推理、指令遵循、智能体能力和多语言支持方面取得突破性进展。
大型语言模型
Transformers

Q
Qwen
395.72k
113
Opencodereasoning Nemotron 32B
Apache-2.0
OpenCodeReasoning-Nemotron-32B 是一个基于 Qwen2.5-32B-Instruct 的大型语言模型,专门针对代码生成推理能力进行训练,支持 32K token 的上下文长度,可自由用于商业/非商业用途。
大型语言模型
Transformers 支持多种语言

O
nvidia
1,176
64
Opencodereasoning Nemotron 14B
Apache-2.0
OpenCodeReasoning-Nemotron-14B 是一个专为代码生成推理而进行后训练的大型语言模型,支持32K令牌的上下文长度。
大型语言模型
Transformers 支持多种语言

O
nvidia
247
18
Opencodereasoning Nemotron 7B
Apache-2.0
OpenCodeReasoning-Nemotron-7B 是基于 Qwen2.5-7B-Instruct 开发的大型语言模型,专注于代码生成和推理任务,支持 32K tokens 的上下文长度。
大型语言模型
Transformers 支持多种语言

O
nvidia
5,410
30
Lucie 7B Instruct V1.1
Apache-2.0
基于Lucie-7B微调的多语言因果语言模型,支持法语和英语,专注于指令跟随和文本生成任务。
大型语言模型 支持多种语言
L
OpenLLM-France
13.33k
9
Dbrx Instruct
其他
Databricks开发的专家混合(MoE)大语言模型,专精于少量轮次交互场景
大型语言模型
Transformers

D
databricks
5,005
1,112
Proctora
Proctora是基于混合专家架构(MoE)的模型,结合了角色扮演和事实性回答的专家模块,支持32K上下文长度,在AI-RPG评估中表现优异。
大型语言模型
Transformers

P
Karko
78
5
Llama 2 7B 32K
基于Meta原版Llama-2 7B模型微调的开源长上下文语言模型,支持32K上下文长度
大型语言模型
Transformers 英语

L
togethercomputer
5,411
538
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers 支持多种语言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers 英语

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统 中文
R
uer
2,694
98