指令微调优化

# 指令微调优化

Gemma 3n E4B It Litert Preview GGUF

Gemma-3n-E4B-it-litert-preview是基于Google的Gemma 3n模型微调的版本，支持图像和文本输入并生成文本输出，适用于多模态任务。

图像生成文本

Transformers 英语

Gervasio 8b Portuguese Ptpt Decoder

Gervásio 8B PTPT是一款面向葡萄牙语的开源解码器模型，基于LLaMA 3.1 8B Instruct微调，具备强大的文本生成能力。

大型语言模型

Transformers 其他

Tiiuae.falcon H1 34B Instruct GGUF

Falcon-H1-34B-Instruct 是一个34B参数规模的大型语言模型，专注于指令遵循任务。

大型语言模型

Hyperclovax SEED Text Instruct 0.5B GGUF

基于llama.cpp生成的0.5B参数规模的文本生成模型，支持指令式文本生成任务

大型语言模型

Thedrummer Rivermind Lux 12B V1 GGUF

这是一个12B参数的大语言模型，经过llama.cpp的imatrix量化处理，提供多种量化版本以适应不同硬件需求。

大型语言模型

MN Nyx Chthonia 12B

这是一个基于多个12B参数规模模型的合并版本，采用model_stock方法融合了7个不同特性的预训练语言模型，以增强综合能力。

大型语言模型

mergekit-community

Granite 3.3 8b Instruct Q8 0 GGUF

该模型是基于IBM Granite-3.3-8B指令微调模型转换而来的GGUF格式模型，适用于文本生成任务。

大型语言模型

Opencodereasoning Nemotron 7B

OpenCodeReasoning-Nemotron-7B 是基于 Qwen2.5-7B-Instruct 开发的大型语言模型，专注于代码生成和推理任务，支持 32K tokens 的上下文长度。

大型语言模型

Transformers 支持多种语言

Llama SEA LION V3.5 70B R

Llama-SEA-LION-v3.5-70B-R 是一个专为东南亚语言优化的混合功能大语言模型，支持13种语言，具备复杂推理和通用文本生成能力。

大型语言模型

Transformers 支持多种语言

Flan T5 Titlegen Springer

基于google/flan-t5-base微调的模型，专门用于将科学摘要精炼为简洁标题的抽象摘要生成任务。

Transformers 英语

Qwen.qwen2.5 VL 3B Instruct GGUF

Qwen2.5-VL-3B-Instruct 是一个3B参数的视觉语言模型，支持图文生成文本任务。

图像生成文本

Llama 3.1 8B SuperNova EtherealHermes GGUF

基于Llama-3.1架构的8B参数大语言模型，提供多种量化版本的GGUF格式文件

大型语言模型英语

基于Unsloth和Huggingface TRL库优化的Qwen2模型，推理速度提升2倍

大型语言模型

Transformers 英语

T3Q Qwen2.5 14b V1.0 E3

基于Qwen/Qwen2.5-14B-Instruct-1M模型进行后训练的版本，采用LoRA-8-4-0.0001-cosine-32-16配置，训练数据为train_data_v1.0。

大型语言模型

Transformers 支持多种语言

Qwq 32B Gptqmodel 4bit Vortex V1

QwQ-32B是基于Qwen2架构的32B参数大语言模型，经过GPTQ方法4位整型量化处理，适用于高效文本生成任务。

大型语言模型

Safetensors 英语

Llama 3.1 8B UltraLong 1M Instruct

Nemotron-UltraLong-8B系列是专为处理超长文本序列设计的语言模型，支持最高400万token的上下文窗口，同时保持卓越性能。

大型语言模型

Transformers 英语

Buddyglassuncensored2025.4

这是一个基于 Mistral-Small-24B-Instruct-2501 的融合模型，采用了 DARE TIES 融合方法，整合了多个 24B 参数规模的模型。

大型语言模型

Llama Krikri 8B Instruct GGUF

基于Llama-3.1-8B构建的希腊语指令调优大语言模型，增强希腊语能力并支持多语言任务

大型语言模型

Progenitor V3.3 LLaMa 70B

本项目通过融合多个70B规模的预训练语言模型，旨在创造出性能更优的语言模型。以Llama 3.3指令模型为基础，运用Linear DELLA融合方法进行模型融合。

大型语言模型

Reasoningcore 3B R01

ReasoningCore‑3B 是由 EpitemeAI 开发的多语言、推理能力增强的大语言模型，在推理、对话管理、检索和总结任务中表现出色。

大型语言模型

Transformers 英语

Captain Eris Violet V0.420 12B

Captain Violet 是一个12B参数规模的合并模型，由Epiculous/Violet_Twilight-v0.2和Nitral-AI/Captain_BMO-12B通过mergekit工具合并而成，支持文本生成任务。

大型语言模型

Transformers 英语

Llama SEA LION V3 8B IT

SEA-LION是一系列为东南亚地区预训练和指令微调的大语言模型，致力于解决该地区多语言处理问题，为东南亚语言的自然语言处理提供强大支持。

大型语言模型

Transformers 支持多种语言

Ichigo Llama3.1 S Instruct V0.4

基于Llama-3架构的多模态语言模型，支持音频和文本输入理解，具有噪声鲁棒性和多轮对话能力

文本生成音频英语

Hymba 1.5B Instruct

基于Hymba-1.5B-Base进行指令微调的15亿参数模型，具备数学推理、函数调用、角色扮演等复杂任务处理能力

大型语言模型

Videollama2.1 7B 16F Base

VideoLLaMA2.1是基于VideoLLaMA2的升级版本，专注于提升视频大语言模型中的时空建模与音频理解能力。

视频生成文本

Transformers 英语

Videollama2.1 7B 16F

VideoLLaMA 2是一个多模态大语言模型，专注于视频理解，具备时空建模和音频理解能力。

文本生成视频

Transformers 英语

Llama 3.1 8B Dragonfly V2

蜻蜓是基于Llama 3.1通过指令微调训练的多模态视觉语言模型，支持图像与文本的联合理解与生成

图像生成文本英语

togethercomputer

Llama 3.2 Korean Bllossom 3B

Bllossom-3B是基于meta-llama/Meta-Llama-3.2-3B的韩英双语增强版本，通过全参数微调和精选韩语数据训练，完整保留英语能力的同时增强韩语处理能力。

大型语言模型

Transformers 支持多种语言

Mini Ichigo Llama3.2 3B S Instruct

Ichigo-llama3s系列模型是由Homebrew Research开发的多模态语言模型，原生支持音频和文本输入理解。该模型基于Llama-3架构，通过WhisperVQ作为音频文件标记器进行训练，提升了音频理解能力。

文本生成音频

Safetensors 英语

Ichigo Llama3.1 S Instruct V0.3 Phase 2

Ichigo-llama3s系列模型原生支持音频和文本输入理解，基于Llama-3架构，使用WhisperVQ作为音频文件的tokenizer。

文本生成音频英语

Llama 3.1 8B Instuct Uz GGUF

这是基于behbudiy/Llama-3.1-8B-Instuct-Uz的静态量化版本，支持乌兹别克语和英语，适用于多种文本生成任务。

大型语言模型支持多种语言

Solar Pro Preview Instruct

Solar Pro Preview是一款先进的大语言模型，拥有220亿参数，专为单GPU运行而设计，性能卓越。

大型语言模型

Transformers 英语

EuroLLM-1.7B 是 EuroLLM 系列的首个预训练模型，具备多语言处理能力，可理解和生成多种欧洲及其他相关语言的文本。

大型语言模型

Transformers 支持多种语言

magnum-v2-12b是系列模型中的第四款，旨在复刻Claude 3系列模型（尤其是Sonnet和Opus）的文本质量。基于Mistral-Nemo-Base-2407微调而来，具备强大的文本生成能力。

大型语言模型

Safetensors 支持多种语言

Mistral Nemo Base 2407 Chatml

Mistral-Nemo-Base-2407是由Mistral AI与NVIDIA联合训练的120亿参数生成式文本预训练模型，性能超越同规模或更小规模的模型。

大型语言模型

Transformers 支持多种语言

Meta Llama 3.1 405B Instruct GGUF

Meta-Llama-3.1-405B-Instruct 是一个基于 Llama 3.1 架构的 4050 亿参数大型语言模型，专为指令跟随任务优化，支持多种语言。

大型语言模型支持多种语言

Meta Llama 3.1 8B Instruct GGUF

Llama-3.1-8B-Instruct 是由 Meta 发布的一个 8B 参数规模的大语言模型，专注于指令跟随任务。

大型语言模型

Llama 3 8B Instruct RR

Llama-3-8B-Instruct-RR是一款基于Llama-3的模型，采用表征重路由（RR）技术插入断路器，旨在减少有害内容生成的同时保持模型能力。

大型语言模型

Tarsier-34b 是一个开源的大规模视频语言模型，专注于生成高质量的视频描述，并在多个公开基准测试中取得领先成绩。

视频生成文本

Llama 3 Instruct 8B SimPO SPPO Iter3 Merge

这是一个基于Meta Llama 3构建的合并预训练语言模型，结合了SimPO和SPPO-Iter3两个模型的优势，适用于文本生成任务。

大型语言模型

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

English 简体中文繁體中文にほんご

© 2025AIbase