# 日语增强

Gemma 2 Llama Swallow 27b It V0.1
基于Gemma-2架构的日语增强大语言模型,通过持续预训练显著提升日语能力,同时保留原版英语能力
大型语言模型 Transformers 支持多种语言
G
tokyotech-llm
27
1
Gemma 2 Llama Swallow 9b It V0.1
Gemma-2-Llama-Swallow系列模型是在Gemma-2基础上进行持续预训练构建的多语言大模型,特别增强了日语能力。
大型语言模型 Transformers 支持多种语言
G
tokyotech-llm
2,491
3
Gemma 2 Llama Swallow 2b It V0.1
Gemma-2-Llama-Swallow系列是通过对gemma-2模型进行持续预训练构建的,显著增强了日文语言处理能力,同时保留原有英文能力。
大型语言模型 Transformers 支持多种语言
G
tokyotech-llm
61
1
Gemma2 Alicia 9B
基于TIES方法融合的多语言Gemma-2模型,整合了多个专业领域知识
大型语言模型 Transformers 支持多种语言
G
yamatazen
15
2
Llama 3.3 Swallow 70B V0.4
Llama 3.3 Swallow是一个700亿参数的大语言模型,基于Meta Llama 3.3构建,增强了日语能力同时保留英文能力。
大型语言模型 Transformers 支持多种语言
L
tokyotech-llm
1,950
3
Llama 3.1 Swallow 70B Instruct V0.3
Llama 3.1 Swallow是基于Meta Llama 3.1构建的大语言模型系列,通过持续预训练增强了日语能力,同时保留英文能力。
大型语言模型 Transformers 支持多种语言
L
tokyotech-llm
1,659
12
Llama 3.1 Swallow 8B Instruct V0.3
Llama 3.1 Swallow是基于Meta Llama 3.1构建的大语言模型系列,通过持续预训练增强了日语能力,同时保留英文能力。
大型语言模型 Transformers 支持多种语言
L
tokyotech-llm
16.48k
20
Llama 3.1 Swallow 8B Instruct V0.2
Llama 3.1 Swallow是基于Meta Llama 3.1模型进行持续预训练的大语言模型系列,增强了日语能力同时保留英文能力。
大型语言模型 Transformers 支持多种语言
L
tokyotech-llm
2,283
15
Swallow MX 8x7b NVE V0.1
Apache-2.0
Swallow-MX-8x7b-NVE-v0.1是基于Mixtral-8x7B-Instruct-v0.1进行持续预训练的混合专家模型,主要增强了日语能力。
大型语言模型 Transformers 支持多种语言
S
tokyotech-llm
1,293
29
Swallow MS 7b V0.1
Apache-2.0
Swallow-MS-7b-v0.1是基于Mistral-7B-v0.1持续预训练的日语增强模型,由TokyoTech-LLM开发,在日语任务上表现优异。
大型语言模型 Transformers 支持多种语言
S
tokyotech-llm
736
27
Karakuri Lm 70b Chat V0.1
其他
KARAKURI LM是基于Llama 2构建的预训练语言模型,增强了日语处理能力,并在日语和多语言语料库上进行了进一步预训练。
大型语言模型 Transformers 支持多种语言
K
karakuri-ai
2,300
24
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase