开源大模型

# 开源大模型

SWE Agent LM 32B GGUF

SWE-agent-LM-32B是一个开源的软件工程语言模型，基于Qwen/Qwen2.5-Coder-32B-Instruct微调，专为软件工程任务设计。

大型语言模型

Transformers 英语

dots.llm1 是一个大规模的 MoE 模型，在 1420 亿总参数中激活 140 亿参数，性能可与最先进的模型相媲美。

大型语言模型

Transformers 支持多种语言

Qwen3 30B A3B GGUF

Qwen3-30B-A3B是基于Qwen3-30B-A3B-Base的大语言模型，支持文本生成任务，采用超低位量化技术优化内存效率。

大型语言模型

Bielik 4.5B V3.0 Instruct GGUF

Bielik-4.5B-v3.0-Instruct-GGUF 是 SpeakLeash 发布的波兰语大语言模型，基于 Bielik-4.5B-v3.0-Instruct 转换的 GGUF 量化格式，适用于本地推理。

大型语言模型其他

Qwen3-14B是基于Qwen/Qwen3-14B-Base生成的GGUF格式模型，支持文本生成任务，采用IQ-DynamicGate超低比特量化技术优化内存效率。

大型语言模型

Qwen3 32B 128K GGUF

Qwen3是Qwen系列最新一代的大语言模型，提供了一系列密集和混合专家（MoE）模型。基于广泛的训练，Qwen3在推理、指令遵循、代理能力和多语言支持方面取得了突破性进展。

大型语言模型英语

Qwen3 4B 128K GGUF

Qwen3-4B是Qwen系列最新一代的大语言模型，具有4B参数规模，支持100多种语言，在推理、指令遵循、代理能力和多语言支持方面表现优异。

大型语言模型英语

Qwen3 32B Unsloth Bnb 4bit

Qwen3是通义千问系列大语言模型的最新版本，提供32.8B参数的密集模型，在推理能力、指令遵循、智能体功能和多语言支持方面实现突破性进展。

大型语言模型

Transformers 英语

Openbuddy Qwq 32b V25.2q 200k

专为增强量化推理能力优化的多语言聊天机器人，支持8种语言，基于Qwen/QwQ-32B模型开发

大型语言模型支持多种语言

GLM Z1 9B 0414 Q4 K M GGUF

本模型是THUDM/GLM-Z1-9B-0414的GGUF格式转换版本，支持中英文文本生成任务。

大型语言模型支持多种语言

Deepcoder 1.5B Preview GGUF

基于DeepSeek-R1-Distilled-Qwen-1.5B微调的代码推理大语言模型，采用分布式强化学习技术扩展长上下文处理能力

大型语言模型英语

Open Thoughts OpenThinker2 32B GGUF

OpenThinker2-32B的量化版本，使用llama.cpp进行imatrix量化，支持多种量化类型，适用于文本生成任务。

大型语言模型

FinSeer StockLLM 是一个开源的10亿参数大语言模型，专为金融时间序列预测设计，采用检索增强生成（RAG）框架。

大型语言模型

Transformers 英语

Gemma 3 4b It Q8 0 GGUF

这是Google Gemma 3B模型的GGUF量化版本，适用于本地部署和推理。

大型语言模型

Gemma 3 12b It Q5 K S GGUF

这是Google Gemma 3B模型的GGUF量化版本，适用于本地推理，支持文本生成任务。

大型语言模型

Gemma 3 12b It Q5 K M GGUF

这是由google/gemma-3-12b-it转换而来的GGUF格式模型，适用于llama.cpp框架。

大型语言模型

Qwen.qwen2 VL 7B GGUF

Qwen2-VL-7B的量化版本，致力于让知识为每个人所用。

图像生成文本

Instella 3B Stage1

Instella是由AMD开发的30亿参数开源语言模型系列，基于AMD Instinct™ MI300X GPU训练，性能超越同规模全开源模型。

大型语言模型

Deepseek R1 Distill Qwen 32B Quantized.w8a8

DeepSeek-R1-Distill-Qwen-32B的量化版本，通过INT8权重量化和激活量化减少内存需求并提高计算效率

大型语言模型

Lucie-7B是由LINAGORA和OpenLLM-France联合构建的70亿参数多语言因果语言模型，基于Llama-3架构，在3万亿令牌的多语言数据上预训练而成。

大型语言模型

TensorBoard 支持多种语言

Rombos LLM V2.5 Qwen 32b

Rombos-LLM-V2.5-Qwen-32b是基于Qwen2.5-32B持续微调的模型，性能优于原始的指令模型和基础模型。

大型语言模型

Reflection Llama 3.1 70B

Reflection Llama-3.1 70B 是一款开源大语言模型，采用'反思调优'技术训练，能够自主检测推理错误并修正方向。

大型语言模型

Llama3 ChatQA 2 8B

基于Llama-3基础模型开发的128K长上下文大语言模型，专注于提升RAG和长文本理解能力

大型语言模型

Xgen Mm Phi3 Mini Instruct Interleave R V1.5

xGen-MM是Salesforce AI Research开发的一系列最新基础大型多模态模型（LMMs），在BLIP系列成功设计的基础上进行了改进，通过基础性增强确保了更强大和卓越的模型基础。

图像生成文本英语

Xgen Mm Phi3 Mini Instruct Singleimg R V1.5

xGen-MM是Salesforce AI Research开发的一系列最新基础大型多模态模型，基于BLIP系列的成功设计进行了改进，提供更强大的多模态处理能力。

图像生成文本

Safetensors 英语

Tarsier-7b 是 Tarsier 系列的开源大规模视频语言模型，专注于生成高质量视频描述并具备优秀的通用视频理解能力。

视频生成文本

Llama 3 ChocoLlama 8B Instruct

基于Llama-3-8B的荷兰语指令优化大模型，通过SFT和DPO在多个荷兰语指令数据集上微调而成

大型语言模型

Transformers 其他

Mistral 7B V0.3

Mistral-7B-v0.3是基于Mistral-7B-v0.2升级的大语言模型，主要改进是扩展了词汇表至32768个词元。

大型语言模型

Xgen Mm Phi3 Mini Instruct R V1

xGen-MM是Salesforce AI Research开发的最新基础大型多模态模型系列，基于BLIP系列改进，具有强大的图像理解和文本生成能力。

图像生成文本

Transformers 英语

Llama 2 13B QServe

Llama 2 是 Meta 开发的一系列开源大语言模型，包括不同规模的预训练和微调版本，适用于对话和生成任务。

大型语言模型

Llama 2 是 Meta 发布的新一代开源大语言模型，包含 7B、13B 和 70B 三种参数规模版本，支持商用许可。

大型语言模型

Llama 3 Open Ko 8B Gguf

基于Llama-3-8B框架继续预训练的韩语语言模型，使用超过60GB去重文本数据训练

大型语言模型支持多种语言

Snowflake Arctic Base

雪花北极是由雪花AI研究团队开发的密集混合专家（MoE）架构大语言模型，具有4800亿参数，专为高效文本和代码生成设计。

大型语言模型

Lm3 8 Bnb 4bit V1.0

基于Llama 2架构的韩语文本生成模型，专注于韩语自然语言处理任务

大型语言模型

Transformers 韩语

巫师湖7B是新一代WizardLM 2 7B模型与定制DolphinLake模型的融合模型，表现优异。

大型语言模型

Microsoft WizardLM 2 7B

WizardLM-2 7B是微软AI团队开发的高效大语言模型，基于Mistral-7B架构，在多语言、推理和代理任务上表现优异。

大型语言模型

OpenELM是一组开源高效语言模型，采用分层缩放策略优化参数分配，提升模型准确率。包含270M、450M、1.1B和3B四种参数规模，提供预训练和指令调优版本。

大型语言模型

JetMoE-8B是一款高效开源大语言模型，以不足10万美元的训练成本达到LLaMA2-7B性能水平，专为低资源环境设计。

大型语言模型

Mistral Orpo Beta

Mistral-ORPO-β是基于Mistral-7B使用ORPO方法微调的7B参数语言模型，无需监督微调预热阶段即可直接学习偏好。

大型语言模型

Transformers 英语

Cogvlm Grounding Generalist Hf Quant4

CogVLM是一款强大的开源视觉语言模型，支持目标检测和视觉问答等任务，采用4位精度量化。

图像生成文本

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

English 简体中文繁體中文にほんご

© 2025AIbase