指令调优

# 指令调优

Gemma 3n E2B It

Gemma 3n是Google推出的轻量级、最先进的开源多模态模型家族，基于与Gemini模型相同的研究和技术构建。支持文本、音频和视觉输入，适用于多种任务。

图像生成文本

Gemma 3 27b It Qat Q4 0 Unquantized

Gemma 3是Google推出的轻量级、先进的多模态开放模型，基于与Gemini模型相同的研究和技术构建，支持文本和图像输入并生成文本输出。

文本生成图像

Gemma 3 12b It Qat Q4 0 Gguf

Gemma 3是谷歌基于Gemini技术构建的轻量级开放模型，支持文本和图像输入，生成文本输出。12B版本经过指令调优，适用于多种生成和理解任务。

图像生成文本

Gemma 3 4b It Quantized W4A16

Gemma 3是Google开发的轻量级开源大语言模型，本仓库提供其4B参数版本的W4A16量化模型，显著降低硬件需求。

大型语言模型

Gemma 3 12b It Qat Q4 0 Gguf

Gemma 3是谷歌推出的轻量级尖端开源多模态模型，支持图文输入与文本输出，具有128K上下文窗口和140+语言支持。

图像生成文本

Gemma 3是Google推出的轻量级先进开放模型系列，基于与Gemini模型相同的研究和技术构建。该模型是多模态模型，能够处理文本和图像输入并生成文本输出。

文本生成图像

Modernbert Large Nli

基于ModernBERT-large模型，通过多任务微调优化的自然语言推理模型，在零样本分类和NLI任务上表现优异。

大型语言模型

Transformers 支持多种语言

Llama 3.1 Swallow 70B Instruct V0.3

Llama 3.1 Swallow是基于Meta Llama 3.1构建的大语言模型系列，通过持续预训练增强了日语能力，同时保留英文能力。

大型语言模型

Transformers 支持多种语言

Llama SEA LION V3 70B IT

SEA-LION 是一个针对东南亚语言优化的大语言模型系列，支持13种东南亚语言，基于Llama 3.1架构构建。

大型语言模型

Transformers 支持多种语言

Llama 3 ELYZA JP 8B

由ELYZA公司训练的大型语言模型，基于Meta-Llama-3-8B-Instruct增强日语能力

大型语言模型

Transformers 支持多种语言

Gemma是Google推出的轻量级开源大语言模型系列，基于创建Gemini模型的相同技术构建，适用于多种文本生成任务。

大型语言模型

It 5.3 Fp16 32k

旋风0.5*是一个支持俄语和英语的开源大语言模型，扩展了RoPE上下文窗口至32k，优化了JSON处理和多轮对话能力

大型语言模型

Transformers 支持多种语言

Codegemma 1.1 2b

CodeGemma是基于Gemma构建的轻量级开源代码模型集合，支持代码补全、生成和对话等多种任务。

大型语言模型

Meta Llama 3 70B Instruct AWQ

Meta-Llama-3-70B-Instruct是Meta发布的70B参数规模的指令调优大语言模型，针对对话用例优化，在安全性和帮助性方面表现突出。

大型语言模型

Transformers 英语

Openelm 450M Instruct

OpenELM是一组开源高效语言模型，采用分层缩放策略优化参数分配，包含2.7亿至30亿参数的预训练及指令调优版本。

大型语言模型

Openelm 270M Instruct

OpenELM是一系列开放、高效的语言模型，采用逐层缩放策略在Transformer模型的每一层内高效分配参数，提高了准确性。

大型语言模型

OpenELM是一组开源高效语言模型，采用分层缩放策略在Transformer模型的每一层中高效分配参数，提升准确性。

大型语言模型

Gemma 1.1 7b It

Gemma是Google推出的轻量级开放模型系列，基于与Gemini相同技术构建，适用于文本生成任务。

大型语言模型

Codegemma 7b It

CodeGemma是基于Gemma构建的轻量级开源代码模型集合，专长于代码生成、补全和对话任务。

大型语言模型

Codegemma 7b It GGUF

CodeGemma是基于Gemma构建的轻量级开源代码模型系列，专注于代码补全、生成和对话任务。

大型语言模型

Codellama 13b Instruct Hf

Code Llama是Meta发布的预训练生成文本模型系列，专注于代码生成与理解，包含70亿至340亿参数的不同版本。

大型语言模型

Transformers 其他

Cendol Llama2 7b Chat

仙都（Cendol）是一个开源的、针对印尼语进行微调的生成式大语言模型集合，涵盖多种架构和参数规模。

大型语言模型

Transformers 其他

基于Llama 2系列增强日语能力的开源大语言模型，提供7B/13B/70B三种规模及指令调优版本

大型语言模型

Transformers 支持多种语言

Llama2 MedTuned 7b

基于Llama2 7B模型进行指令调优的生物医学领域专用模型

大型语言模型

Codellama 13b Instruct Hf

CodeLlama-13b-Instruct是Meta发布的130亿参数指令调优代码生成模型，专为安全指令跟随和代码助手应用设计

大型语言模型

Transformers 其他

Gpt2 Open Instruct V1

这是一个基于open-instruct-v1数据集微调的GPT2模型，采用羊驼格式的提示模板进行指令调优。

大型语言模型

Transformers 英语

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

English 简体中文繁體中文にほんご

© 2025AIbase