日语增强

# 日语增强

Gemma 2 Llama Swallow 27b It V0.1

基于Gemma-2架构的日语增强大语言模型，通过持续预训练显著提升日语能力，同时保留原版英语能力

大型语言模型

Transformers 支持多种语言

Gemma 2 Llama Swallow 9b It V0.1

Gemma-2-Llama-Swallow系列模型是在Gemma-2基础上进行持续预训练构建的多语言大模型，特别增强了日语能力。

大型语言模型

Transformers 支持多种语言

Gemma 2 Llama Swallow 2b It V0.1

Gemma-2-Llama-Swallow系列是通过对gemma-2模型进行持续预训练构建的，显著增强了日文语言处理能力，同时保留原有英文能力。

大型语言模型

Transformers 支持多种语言

Gemma2 Alicia 9B

基于TIES方法融合的多语言Gemma-2模型，整合了多个专业领域知识

大型语言模型

Transformers 支持多种语言

Llama 3.3 Swallow 70B V0.4

Llama 3.3 Swallow是一个700亿参数的大语言模型，基于Meta Llama 3.3构建，增强了日语能力同时保留英文能力。

大型语言模型

Transformers 支持多种语言

Llama 3.1 Swallow 70B Instruct V0.3

Llama 3.1 Swallow是基于Meta Llama 3.1构建的大语言模型系列，通过持续预训练增强了日语能力，同时保留英文能力。

大型语言模型

Transformers 支持多种语言

Llama 3.1 Swallow 8B Instruct V0.3

Llama 3.1 Swallow是基于Meta Llama 3.1构建的大语言模型系列，通过持续预训练增强了日语能力，同时保留英文能力。

大型语言模型

Transformers 支持多种语言

Llama 3.1 Swallow 8B Instruct V0.2

Llama 3.1 Swallow是基于Meta Llama 3.1模型进行持续预训练的大语言模型系列，增强了日语能力同时保留英文能力。

大型语言模型

Transformers 支持多种语言

Swallow MX 8x7b NVE V0.1

Swallow-MX-8x7b-NVE-v0.1是基于Mixtral-8x7B-Instruct-v0.1进行持续预训练的混合专家模型，主要增强了日语能力。

大型语言模型

Transformers 支持多种语言

Swallow MS 7b V0.1

Swallow-MS-7b-v0.1是基于Mistral-7B-v0.1持续预训练的日语增强模型，由TokyoTech-LLM开发，在日语任务上表现优异。

大型语言模型

Transformers 支持多种语言

Karakuri Lm 70b Chat V0.1

KARAKURI LM是基于Llama 2构建的预训练语言模型，增强了日语处理能力，并在日语和多语言语料库上进行了进一步预训练。

大型语言模型

Transformers 支持多种语言

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

English 简体中文繁體中文にほんご

© 2025AIbase