# 日英雙語

Orihime 12B
Orihime-12B 是一個使用 mergekit 工具合併的預訓練語言模型,基於 shisa-v2-mistral-nemo-12b 和 Himeyuri-v0.1-12B 模型融合而成,支持英文和日文。
大型語言模型 Transformers 支持多種語言
O
yamatazen
48
2
ELYZA Shortcut 1.0 Qwen 32B
Apache-2.0
ELYZA-Shortcut-1.0-Qwen-32B是基於Qwen2.5-32B-Instruct開發的非推理模型,能夠繞過推理步驟直接生成最終答案。
大型語言模型 Transformers 支持多種語言
E
elyza
172
2
Gemma 2 Llama Swallow 2b It V0.1
Gemma-2-Llama-Swallow系列是通過對gemma-2模型進行持續預訓練構建的,顯著增強了日文語言處理能力,同時保留原有英文能力。
大型語言模型 Transformers 支持多種語言
G
tokyotech-llm
61
1
HMS Slerp 12B
HMS-Slerp-12B 是一個採用SLERP球面線性插值法合併的多語言聊天模型,支持英語和日語。
大型語言模型 Transformers 支持多種語言
H
yamatazen
41
2
Elvenmaid 12B Stock
基於ElvenMaid-12B系列模型合併的ChatML格式語言模型,支持英文和日文
大型語言模型 Transformers 支持多種語言
E
yamatazen
35
2
Elvenmaid 12B V2
ElvenMaid-12B-v2 是一個基於 ChatML 格式的 12B 參數語言模型,通過 mergekit 的 TIES 方法合併多個預訓練模型而成,支持英文和日文交互。
大型語言模型 Transformers 支持多種語言
E
yamatazen
50
4
Heron NVILA Lite 1B
Apache-2.0
基於NVILA-Lite架構訓練的日語視覺語言模型,支持日語和英語的圖文交互
圖像生成文本 支持多種語言
H
turing-motors
460
2
Etherealaurora 12B V2
基於ChatML架構的對話模型,通過mergekit工具合併預訓練語言模型生成
大型語言模型 Transformers 支持多種語言
E
yamatazen
859
16
Llama 3 VNTL Yollisa 8B GGUF
這是一個基於Llama-3架構的8B參數模型,專注於視覺小說和日本御宅族媒體內容的翻譯與處理。
大型語言模型 支持多種語言
L
mradermacher
53
1
Aurora SCE 12B
基於SCE方法合併的多語言ChatML模型,支持英文和日文對話
大型語言模型 Transformers 支持多種語言
A
yamatazen
51
6
Llama 3.1 Swallow 70B Instruct V0.3
Llama 3.1 Swallow是基於Meta Llama 3.1構建的大語言模型系列,通過持續預訓練增強了日語能力,同時保留英文能力。
大型語言模型 Transformers 支持多種語言
L
tokyotech-llm
1,659
12
Llama 3.1 Swallow 8B Instruct V0.3
Llama 3.1 Swallow是基於Meta Llama 3.1構建的大語言模型系列,通過持續預訓練增強了日語能力,同時保留英文能力。
大型語言模型 Transformers 支持多種語言
L
tokyotech-llm
16.48k
20
Llama 3.1 Swallow 8B Instruct V0.2
Llama 3.1 Swallow是基於Meta Llama 3.1模型進行持續預訓練的大語言模型系列,增強了日語能力同時保留英文能力。
大型語言模型 Transformers 支持多種語言
L
tokyotech-llm
2,283
15
Mistral Nemo Japanese Instruct 2408
Apache-2.0
這是一個基於Mistral-Nemo-Instruct-2407的日語持續預訓練模型,專注於日語文本生成任務。
大型語言模型 Safetensors 支持多種語言
M
cyberagent
1,898
39
Llama 3 Swallow 8B Instruct V0.1
基於Meta Llama 3構建的日語優化大語言模型,通過持續預訓練增強日語能力,採用監督微調提升指令跟隨能力
大型語言模型 Transformers 支持多種語言
L
tokyotech-llm
13.88k
20
Llama 3 ELYZA JP 8B
由ELYZA公司訓練的大型語言模型,基於Meta-Llama-3-8B-Instruct增強日語能力
大型語言模型 Transformers 支持多種語言
L
elyza
13.52k
113
Llava Calm2 Siglip
Apache-2.0
llava-calm2-siglip 是一個實驗性的視覺語言模型,能夠用日語和英語回答關於圖像的問題。
圖像生成文本 Transformers 支持多種語言
L
cyberagent
3,930
25
Shisa V1 Llama3 8b
基於Meta-Llama-3-8B-Instruct微調的日語優化大語言模型,在多個日語基準測試中表現優異
大型語言模型 Transformers
S
shisa-ai
28
6
Llama 3 8B Japanese Instruct
這是一個基於日語對話數據集微調的Meta-Llama-3-8B-Instruct模型,專注於日語對話任務。
大型語言模型 Transformers 支持多種語言
L
haqishen
33
22
Fugaku LLM 13B
其他
Fugaku-LLM是使用超級計算機'富嶽'從零開始預訓練的日本國產大語言模型,具有高度透明性和安全性,日語表現尤為出色
大型語言模型 Transformers 支持多種語言
F
Fugaku-LLM
25
123
Swallow MS 7b Instruct V0.1
Apache-2.0
基於Mistral-7B-v0.1進行持續預訓練的日語增強大語言模型
大型語言模型 Transformers 支持多種語言
S
tokyotech-llm
48
14
Swallow MS 7b V0.1
Apache-2.0
Swallow-MS-7b-v0.1是基於Mistral-7B-v0.1持續預訓練的日語增強模型,由TokyoTech-LLM開發,在日語任務上表現優異。
大型語言模型 Transformers 支持多種語言
S
tokyotech-llm
736
27
ELYZA Japanese Llama 2 13b Fast Instruct
基於Llama 2的日語優化模型,專為提升日語交互體驗而設計
大型語言模型 Transformers 支持多種語言
E
elyza
1,109
23
ELYZA Japanese Llama 2 13b Instruct
ELYZA-japanese-Llama-2-13b是基於Llama 2進行額外預訓練以擴展日語能力的模型。
大型語言模型 Transformers 支持多種語言
E
elyza
1,022
40
ELYZA Japanese Llama 2 7b Fast Instruct
基於Llama2架構,通過追加預訓練擴展日語能力的語言模型
大型語言模型 Transformers 支持多種語言
E
elyza
1,576
75
ELYZA Japanese Llama 2 7b Instruct
基於Llama2架構,通過追加預訓練擴展日語能力的語言模型
大型語言模型 Transformers 支持多種語言
E
elyza
5,917
67
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase