# 日語增強

Gemma 2 Llama Swallow 27b It V0.1
基於Gemma-2架構的日語增強大語言模型,通過持續預訓練顯著提升日語能力,同時保留原版英語能力
大型語言模型 Transformers 支持多種語言
G
tokyotech-llm
27
1
Gemma 2 Llama Swallow 9b It V0.1
Gemma-2-Llama-Swallow系列模型是在Gemma-2基礎上進行持續預訓練構建的多語言大模型,特別增強了日語能力。
大型語言模型 Transformers 支持多種語言
G
tokyotech-llm
2,491
3
Gemma 2 Llama Swallow 2b It V0.1
Gemma-2-Llama-Swallow系列是通過對gemma-2模型進行持續預訓練構建的,顯著增強了日文語言處理能力,同時保留原有英文能力。
大型語言模型 Transformers 支持多種語言
G
tokyotech-llm
61
1
Gemma2 Alicia 9B
基於TIES方法融合的多語言Gemma-2模型,整合了多個專業領域知識
大型語言模型 Transformers 支持多種語言
G
yamatazen
15
2
Llama 3.3 Swallow 70B V0.4
Llama 3.3 Swallow是一個700億參數的大語言模型,基於Meta Llama 3.3構建,增強了日語能力同時保留英文能力。
大型語言模型 Transformers 支持多種語言
L
tokyotech-llm
1,950
3
Llama 3.1 Swallow 70B Instruct V0.3
Llama 3.1 Swallow是基於Meta Llama 3.1構建的大語言模型系列,通過持續預訓練增強了日語能力,同時保留英文能力。
大型語言模型 Transformers 支持多種語言
L
tokyotech-llm
1,659
12
Llama 3.1 Swallow 8B Instruct V0.3
Llama 3.1 Swallow是基於Meta Llama 3.1構建的大語言模型系列,通過持續預訓練增強了日語能力,同時保留英文能力。
大型語言模型 Transformers 支持多種語言
L
tokyotech-llm
16.48k
20
Llama 3.1 Swallow 8B Instruct V0.2
Llama 3.1 Swallow是基於Meta Llama 3.1模型進行持續預訓練的大語言模型系列,增強了日語能力同時保留英文能力。
大型語言模型 Transformers 支持多種語言
L
tokyotech-llm
2,283
15
Swallow MX 8x7b NVE V0.1
Apache-2.0
Swallow-MX-8x7b-NVE-v0.1是基於Mixtral-8x7B-Instruct-v0.1進行持續預訓練的混合專家模型,主要增強了日語能力。
大型語言模型 Transformers 支持多種語言
S
tokyotech-llm
1,293
29
Swallow MS 7b V0.1
Apache-2.0
Swallow-MS-7b-v0.1是基於Mistral-7B-v0.1持續預訓練的日語增強模型,由TokyoTech-LLM開發,在日語任務上表現優異。
大型語言模型 Transformers 支持多種語言
S
tokyotech-llm
736
27
Karakuri Lm 70b Chat V0.1
其他
KARAKURI LM是基於Llama 2構建的預訓練語言模型,增強了日語處理能力,並在日語和多語言語料庫上進行了進一步預訓練。
大型語言模型 Transformers 支持多種語言
K
karakuri-ai
2,300
24
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase