Gemma 2 Llama Swallow 27b It V0.1
基於Gemma-2架構的日語增強大語言模型,通過持續預訓練顯著提升日語能力,同時保留原版英語能力
大型語言模型
Transformers 支持多種語言

G
tokyotech-llm
27
1
Gemma 2 Llama Swallow 9b It V0.1
Gemma-2-Llama-Swallow系列模型是在Gemma-2基礎上進行持續預訓練構建的多語言大模型,特別增強了日語能力。
大型語言模型
Transformers 支持多種語言

G
tokyotech-llm
2,491
3
Gemma 2 Llama Swallow 2b It V0.1
Gemma-2-Llama-Swallow系列是通過對gemma-2模型進行持續預訓練構建的,顯著增強了日文語言處理能力,同時保留原有英文能力。
大型語言模型
Transformers 支持多種語言

G
tokyotech-llm
61
1
Gemma2 Alicia 9B
基於TIES方法融合的多語言Gemma-2模型,整合了多個專業領域知識
大型語言模型
Transformers 支持多種語言

G
yamatazen
15
2
Llama 3.3 Swallow 70B V0.4
Llama 3.3 Swallow是一個700億參數的大語言模型,基於Meta Llama 3.3構建,增強了日語能力同時保留英文能力。
大型語言模型
Transformers 支持多種語言

L
tokyotech-llm
1,950
3
Llama 3.1 Swallow 70B Instruct V0.3
Llama 3.1 Swallow是基於Meta Llama 3.1構建的大語言模型系列,通過持續預訓練增強了日語能力,同時保留英文能力。
大型語言模型
Transformers 支持多種語言

L
tokyotech-llm
1,659
12
Llama 3.1 Swallow 8B Instruct V0.3
Llama 3.1 Swallow是基於Meta Llama 3.1構建的大語言模型系列,通過持續預訓練增強了日語能力,同時保留英文能力。
大型語言模型
Transformers 支持多種語言

L
tokyotech-llm
16.48k
20
Llama 3.1 Swallow 8B Instruct V0.2
Llama 3.1 Swallow是基於Meta Llama 3.1模型進行持續預訓練的大語言模型系列,增強了日語能力同時保留英文能力。
大型語言模型
Transformers 支持多種語言

L
tokyotech-llm
2,283
15
Swallow MX 8x7b NVE V0.1
Apache-2.0
Swallow-MX-8x7b-NVE-v0.1是基於Mixtral-8x7B-Instruct-v0.1進行持續預訓練的混合專家模型,主要增強了日語能力。
大型語言模型
Transformers 支持多種語言

S
tokyotech-llm
1,293
29
Swallow MS 7b V0.1
Apache-2.0
Swallow-MS-7b-v0.1是基於Mistral-7B-v0.1持續預訓練的日語增強模型,由TokyoTech-LLM開發,在日語任務上表現優異。
大型語言模型
Transformers 支持多種語言

S
tokyotech-llm
736
27
Karakuri Lm 70b Chat V0.1
其他
KARAKURI LM是基於Llama 2構建的預訓練語言模型,增強了日語處理能力,並在日語和多語言語料庫上進行了進一步預訓練。
大型語言模型
Transformers 支持多種語言

K
karakuri-ai
2,300
24
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98