# 指令微调优化

Gemma 3n E4B It Litert Preview GGUF
Gemma-3n-E4B-it-litert-preview是基于Google的Gemma 3n模型微调的版本,支持图像和文本输入并生成文本输出,适用于多模态任务。
图像生成文本 Transformers 英语
G
unsloth
134
1
Gervasio 8b Portuguese Ptpt Decoder
MIT
Gervásio 8B PTPT是一款面向葡萄牙语的开源解码器模型,基于LLaMA 3.1 8B Instruct微调,具备强大的文本生成能力。
大型语言模型 Transformers 其他
G
PORTULAN
105
1
Tiiuae.falcon H1 34B Instruct GGUF
Falcon-H1-34B-Instruct 是一个34B参数规模的大型语言模型,专注于指令遵循任务。
大型语言模型
T
DevQuasar
319
1
Hyperclovax SEED Text Instruct 0.5B GGUF
其他
基于llama.cpp生成的0.5B参数规模的文本生成模型,支持指令式文本生成任务
大型语言模型
H
Mungert
407
1
Thedrummer Rivermind Lux 12B V1 GGUF
这是一个12B参数的大语言模型,经过llama.cpp的imatrix量化处理,提供多种量化版本以适应不同硬件需求。
大型语言模型
T
bartowski
1,353
1
MN Nyx Chthonia 12B
这是一个基于多个12B参数规模模型的合并版本,采用model_stock方法融合了7个不同特性的预训练语言模型,以增强综合能力。
大型语言模型 Transformers
M
mergekit-community
31
2
Granite 3.3 8b Instruct Q8 0 GGUF
Apache-2.0
该模型是基于IBM Granite-3.3-8B指令微调模型转换而来的GGUF格式模型,适用于文本生成任务。
大型语言模型
G
NikolayKozloff
36
2
Opencodereasoning Nemotron 7B
Apache-2.0
OpenCodeReasoning-Nemotron-7B 是基于 Qwen2.5-7B-Instruct 开发的大型语言模型,专注于代码生成和推理任务,支持 32K tokens 的上下文长度。
大型语言模型 Transformers 支持多种语言
O
nvidia
5,410
30
Llama SEA LION V3.5 70B R
Llama-SEA-LION-v3.5-70B-R 是一个专为东南亚语言优化的混合功能大语言模型,支持13种语言,具备复杂推理和通用文本生成能力。
大型语言模型 Transformers 支持多种语言
L
aisingapore
2,406
1
Flan T5 Titlegen Springer
MIT
基于google/flan-t5-base微调的模型,专门用于将科学摘要精炼为简洁标题的抽象摘要生成任务。
文本生成 Transformers 英语
F
tiam4tt
236
0
Qwen.qwen2.5 VL 3B Instruct GGUF
Qwen2.5-VL-3B-Instruct 是一个3B参数的视觉语言模型,支持图文生成文本任务。
图像生成文本
Q
DevQuasar
1,107
3
Llama 3.1 8B SuperNova EtherealHermes GGUF
Apache-2.0
基于Llama-3.1架构的8B参数大语言模型,提供多种量化版本的GGUF格式文件
大型语言模型 英语
L
tensorblock
44
1
Nano R1 Model
Apache-2.0
基于Unsloth和Huggingface TRL库优化的Qwen2模型,推理速度提升2倍
大型语言模型 Transformers 英语
N
Mansi-30
25
2
T3Q Qwen2.5 14b V1.0 E3
Apache-2.0
基于Qwen/Qwen2.5-14B-Instruct-1M模型进行后训练的版本,采用LoRA-8-4-0.0001-cosine-32-16配置,训练数据为train_data_v1.0。
大型语言模型 Transformers 支持多种语言
T
JungZoona
1,557
25
Qwq 32B Gptqmodel 4bit Vortex V1
Apache-2.0
QwQ-32B是基于Qwen2架构的32B参数大语言模型,经过GPTQ方法4位整型量化处理,适用于高效文本生成任务。
大型语言模型 Safetensors 英语
Q
ModelCloud
1,620
11
Llama 3.1 8B UltraLong 1M Instruct
Nemotron-UltraLong-8B系列是专为处理超长文本序列设计的语言模型,支持最高400万token的上下文窗口,同时保持卓越性能。
大型语言模型 Transformers 英语
L
nvidia
1,387
26
Buddyglassuncensored2025.4
这是一个基于 Mistral-Small-24B-Instruct-2501 的融合模型,采用了 DARE TIES 融合方法,整合了多个 24B 参数规模的模型。
大型语言模型 Transformers
B
darkc0de
52
4
Llama Krikri 8B Instruct GGUF
基于Llama-3.1-8B构建的希腊语指令调优大语言模型,增强希腊语能力并支持多语言任务
大型语言模型 Transformers
L
ilsp
257
11
Progenitor V3.3 LLaMa 70B
本项目通过融合多个70B规模的预训练语言模型,旨在创造出性能更优的语言模型。以Llama 3.3指令模型为基础,运用Linear DELLA融合方法进行模型融合。
大型语言模型 Transformers
P
Tarek07
101
10
Reasoningcore 3B R01
Apache-2.0
ReasoningCore‑3B 是由 EpitemeAI 开发的多语言、推理能力增强的大语言模型,在推理、对话管理、检索和总结任务中表现出色。
大型语言模型 Transformers 英语
R
EpistemeAI
1,733
2
Captain Eris Violet V0.420 12B
其他
Captain Violet 是一个12B参数规模的合并模型,由Epiculous/Violet_Twilight-v0.2和Nitral-AI/Captain_BMO-12B通过mergekit工具合并而成,支持文本生成任务。
大型语言模型 Transformers 英语
C
Nitral-AI
445.12k
41
Llama SEA LION V3 8B IT
SEA-LION是一系列为东南亚地区预训练和指令微调的大语言模型,致力于解决该地区多语言处理问题,为东南亚语言的自然语言处理提供强大支持。
大型语言模型 Transformers 支持多种语言
L
aisingapore
3,954
7
Ichigo Llama3.1 S Instruct V0.4
Apache-2.0
基于Llama-3架构的多模态语言模型,支持音频和文本输入理解,具有噪声鲁棒性和多轮对话能力
文本生成音频 英语
I
homebrewltd
486
19
Hymba 1.5B Instruct
其他
基于Hymba-1.5B-Base进行指令微调的15亿参数模型,具备数学推理、函数调用、角色扮演等复杂任务处理能力
大型语言模型 Transformers
H
nvidia
3,547
227
Videollama2.1 7B 16F Base
Apache-2.0
VideoLLaMA2.1是基于VideoLLaMA2的升级版本,专注于提升视频大语言模型中的时空建模与音频理解能力。
视频生成文本 Transformers 英语
V
DAMO-NLP-SG
179
1
Videollama2.1 7B 16F
Apache-2.0
VideoLLaMA 2是一个多模态大语言模型,专注于视频理解,具备时空建模和音频理解能力。
文本生成视频 Transformers 英语
V
DAMO-NLP-SG
2,813
10
Llama 3.1 8B Dragonfly V2
蜻蜓是基于Llama 3.1通过指令微调训练的多模态视觉语言模型,支持图像与文本的联合理解与生成
图像生成文本 英语
L
togethercomputer
113
1
Llama 3.2 Korean Bllossom 3B
Bllossom-3B是基于meta-llama/Meta-Llama-3.2-3B的韩英双语增强版本,通过全参数微调和精选韩语数据训练,完整保留英语能力的同时增强韩语处理能力。
大型语言模型 Transformers 支持多种语言
L
Bllossom
12.52k
173
Mini Ichigo Llama3.2 3B S Instruct
Apache-2.0
Ichigo-llama3s系列模型是由Homebrew Research开发的多模态语言模型,原生支持音频和文本输入理解。该模型基于Llama-3架构,通过WhisperVQ作为音频文件标记器进行训练,提升了音频理解能力。
文本生成音频 Safetensors 英语
M
Menlo
22
34
Ichigo Llama3.1 S Instruct V0.3 Phase 2
Apache-2.0
Ichigo-llama3s系列模型原生支持音频和文本输入理解,基于Llama-3架构,使用WhisperVQ作为音频文件的tokenizer。
文本生成音频 英语
I
homebrewltd
16
5
Llama 3.1 8B Instuct Uz GGUF
这是基于behbudiy/Llama-3.1-8B-Instuct-Uz的静态量化版本,支持乌兹别克语和英语,适用于多种文本生成任务。
大型语言模型 支持多种语言
L
mradermacher
241
1
Solar Pro Preview Instruct
MIT
Solar Pro Preview是一款先进的大语言模型,拥有220亿参数,专为单GPU运行而设计,性能卓越。
大型语言模型 Transformers 英语
S
upstage
10.60k
448
Eurollm 1.7B
Apache-2.0
EuroLLM-1.7B 是 EuroLLM 系列的首个预训练模型,具备多语言处理能力,可理解和生成多种欧洲及其他相关语言的文本。
大型语言模型 Transformers 支持多种语言
E
utter-project
3,444
65
Magnum V2 12b
Apache-2.0
magnum-v2-12b是系列模型中的第四款,旨在复刻Claude 3系列模型(尤其是Sonnet和Opus)的文本质量。基于Mistral-Nemo-Base-2407微调而来,具备强大的文本生成能力。
大型语言模型 Safetensors 支持多种语言
M
anthracite-org
18.68k
89
Mistral Nemo Base 2407 Chatml
Apache-2.0
Mistral-Nemo-Base-2407是由Mistral AI与NVIDIA联合训练的120亿参数生成式文本预训练模型,性能超越同规模或更小规模的模型。
大型语言模型 Transformers 支持多种语言
M
IntervitensInc
191
3
Meta Llama 3.1 405B Instruct GGUF
Meta-Llama-3.1-405B-Instruct 是一个基于 Llama 3.1 架构的 4050 亿参数大型语言模型,专为指令跟随任务优化,支持多种语言。
大型语言模型 支持多种语言
M
MaziyarPanahi
189.43k
14
Meta Llama 3.1 8B Instruct GGUF
Llama-3.1-8B-Instruct 是由 Meta 发布的一个 8B 参数规模的大语言模型,专注于指令跟随任务。
大型语言模型
M
DevQuasar
485
3
Llama 3 8B Instruct RR
Llama-3-8B-Instruct-RR是一款基于Llama-3的模型,采用表征重路由(RR)技术插入断路器,旨在减少有害内容生成的同时保持模型能力。
大型语言模型 Transformers
L
GraySwanAI
3,676
13
Tarsier 34b
Apache-2.0
Tarsier-34b 是一个开源的大规模视频语言模型,专注于生成高质量的视频描述,并在多个公开基准测试中取得领先成绩。
视频生成文本 Transformers
T
omni-research
103
17
Llama 3 Instruct 8B SimPO SPPO Iter3 Merge
这是一个基于Meta Llama 3构建的合并预训练语言模型,结合了SimPO和SPPO-Iter3两个模型的优势,适用于文本生成任务。
大型语言模型 Transformers
L
grimjim
8,305
4
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase