32K长上下文

# 32K长上下文

Skywork SWE 32B GGUF

Skywork SWE 32B是一款专为软件工程（SWE）任务设计的代码代理模型，能有效提升相关任务的处理效率和准确性。

大型语言模型

lmstudio-community

Opencodereasoning Nemotron 32B IOI GGUF

基于Qwen2.5-32B-Instruct的大语言模型，专为代码生成推理而进行了后训练，支持32K上下文长度，适用于商业和非商业用途。

大型语言模型

Seed Coder 8B Instruct GGUF

Seed-Coder-8B-Instruct 是一款强大的开源代码模型，具有以模型为中心、透明和高性能等特点，在多种编码任务中表现出色。

大型语言模型

Qwen3 1.7B GGUF

Qwen3是通义千问系列大语言模型的最新代际，提供稠密和混合专家(MoE)模型的全面套件。基于大规模训练，Qwen3在推理、指令遵循、智能体能力和多语言支持方面实现了突破性进展。

大型语言模型

Opencodereasoning Nemotron 14B GGUF

OpenCodeReasoning-Nemotron-14B 是基于 Qwen2.5-14B-Instruct 进行后训练的大型语言模型，专为代码生成推理优化，支持32K tokens上下文长度。

大型语言模型支持多种语言

Opencodereasoning Nemotron 32B GGUF

OpenCodeReasoning-Nemotron-32B 是基于 Qwen2.5-32B-Instruct 的代码生成推理模型，支持32K tokens上下文长度，适用于商业和非商业用途。

大型语言模型支持多种语言

Opencodereasoning Nemotron 32B IOI

OpenCodeReasoning-Nemotron-32B-IOI 是一个基于 Qwen2.5-32B-Instruct 的大型语言模型，专门针对代码生成任务进行了推理后训练，支持 32K token 的上下文长度。

大型语言模型

Transformers 支持多种语言

Qwen3-0.6B-FP8是通义千问系列大语言模型的最新版本，提供0.6B参数的FP8量化版本，支持思维模式自由切换和多种语言任务。

大型语言模型

Seed Coder 8B Base

Seed-Coder是一个8B规模的开源代码模型家族，包含基础版、指令版和推理版，专注于代码生成和补全任务。

大型语言模型

Qwen3是通义千问系列最新一代大语言模型，提供完整的密集模型和专家混合(MoE)模型组合。基于大规模训练，Qwen3在推理、指令遵循、智能体能力和多语言支持方面取得突破性进展。

大型语言模型

Opencodereasoning Nemotron 32B

OpenCodeReasoning-Nemotron-32B 是一个基于 Qwen2.5-32B-Instruct 的大型语言模型，专门针对代码生成推理能力进行训练，支持 32K token 的上下文长度，可自由用于商业/非商业用途。

大型语言模型

Transformers 支持多种语言

Opencodereasoning Nemotron 14B

OpenCodeReasoning-Nemotron-14B 是一个专为代码生成推理而进行后训练的大型语言模型，支持32K令牌的上下文长度。

大型语言模型

Transformers 支持多种语言

Opencodereasoning Nemotron 7B

OpenCodeReasoning-Nemotron-7B 是基于 Qwen2.5-7B-Instruct 开发的大型语言模型，专注于代码生成和推理任务，支持 32K tokens 的上下文长度。

大型语言模型

Transformers 支持多种语言

Lucie 7B Instruct V1.1

基于Lucie-7B微调的多语言因果语言模型，支持法语和英语，专注于指令跟随和文本生成任务。

大型语言模型支持多种语言

Databricks开发的专家混合(MoE)大语言模型，专精于少量轮次交互场景

大型语言模型

Proctora是基于混合专家架构(MoE)的模型，结合了角色扮演和事实性回答的专家模块，支持32K上下文长度，在AI-RPG评估中表现优异。

大型语言模型

基于Meta原版Llama-2 7B模型微调的开源长上下文语言模型，支持32K上下文长度

大型语言模型

Transformers 英语

togethercomputer

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

English 简体中文繁體中文にほんご

© 2025AIbase