Orihime 12B
Orihime-12B 是一個使用 mergekit 工具合併的預訓練語言模型,基於 shisa-v2-mistral-nemo-12b 和 Himeyuri-v0.1-12B 模型融合而成,支持英文和日文。
大型語言模型
Transformers 支持多種語言

O
yamatazen
48
2
ELYZA Shortcut 1.0 Qwen 32B
Apache-2.0
ELYZA-Shortcut-1.0-Qwen-32B是基於Qwen2.5-32B-Instruct開發的非推理模型,能夠繞過推理步驟直接生成最終答案。
大型語言模型
Transformers 支持多種語言

E
elyza
172
2
Gemma 2 Llama Swallow 2b It V0.1
Gemma-2-Llama-Swallow系列是通過對gemma-2模型進行持續預訓練構建的,顯著增強了日文語言處理能力,同時保留原有英文能力。
大型語言模型
Transformers 支持多種語言

G
tokyotech-llm
61
1
HMS Slerp 12B
HMS-Slerp-12B 是一個採用SLERP球面線性插值法合併的多語言聊天模型,支持英語和日語。
大型語言模型
Transformers 支持多種語言

H
yamatazen
41
2
Elvenmaid 12B Stock
基於ElvenMaid-12B系列模型合併的ChatML格式語言模型,支持英文和日文
大型語言模型
Transformers 支持多種語言

E
yamatazen
35
2
Elvenmaid 12B V2
ElvenMaid-12B-v2 是一個基於 ChatML 格式的 12B 參數語言模型,通過 mergekit 的 TIES 方法合併多個預訓練模型而成,支持英文和日文交互。
大型語言模型
Transformers 支持多種語言

E
yamatazen
50
4
Heron NVILA Lite 1B
Apache-2.0
基於NVILA-Lite架構訓練的日語視覺語言模型,支持日語和英語的圖文交互
圖像生成文本 支持多種語言
H
turing-motors
460
2
Etherealaurora 12B V2
基於ChatML架構的對話模型,通過mergekit工具合併預訓練語言模型生成
大型語言模型
Transformers 支持多種語言

E
yamatazen
859
16
Llama 3 VNTL Yollisa 8B GGUF
這是一個基於Llama-3架構的8B參數模型,專注於視覺小說和日本御宅族媒體內容的翻譯與處理。
大型語言模型 支持多種語言
L
mradermacher
53
1
Aurora SCE 12B
基於SCE方法合併的多語言ChatML模型,支持英文和日文對話
大型語言模型
Transformers 支持多種語言

A
yamatazen
51
6
Llama 3.1 Swallow 70B Instruct V0.3
Llama 3.1 Swallow是基於Meta Llama 3.1構建的大語言模型系列,通過持續預訓練增強了日語能力,同時保留英文能力。
大型語言模型
Transformers 支持多種語言

L
tokyotech-llm
1,659
12
Llama 3.1 Swallow 8B Instruct V0.3
Llama 3.1 Swallow是基於Meta Llama 3.1構建的大語言模型系列,通過持續預訓練增強了日語能力,同時保留英文能力。
大型語言模型
Transformers 支持多種語言

L
tokyotech-llm
16.48k
20
Llama 3.1 Swallow 8B Instruct V0.2
Llama 3.1 Swallow是基於Meta Llama 3.1模型進行持續預訓練的大語言模型系列,增強了日語能力同時保留英文能力。
大型語言模型
Transformers 支持多種語言

L
tokyotech-llm
2,283
15
Mistral Nemo Japanese Instruct 2408
Apache-2.0
這是一個基於Mistral-Nemo-Instruct-2407的日語持續預訓練模型,專注於日語文本生成任務。
大型語言模型
Safetensors 支持多種語言
M
cyberagent
1,898
39
Llama 3 Swallow 8B Instruct V0.1
基於Meta Llama 3構建的日語優化大語言模型,通過持續預訓練增強日語能力,採用監督微調提升指令跟隨能力
大型語言模型
Transformers 支持多種語言

L
tokyotech-llm
13.88k
20
Llama 3 ELYZA JP 8B
由ELYZA公司訓練的大型語言模型,基於Meta-Llama-3-8B-Instruct增強日語能力
大型語言模型
Transformers 支持多種語言

L
elyza
13.52k
113
Llava Calm2 Siglip
Apache-2.0
llava-calm2-siglip 是一個實驗性的視覺語言模型,能夠用日語和英語回答關於圖像的問題。
圖像生成文本
Transformers 支持多種語言

L
cyberagent
3,930
25
Shisa V1 Llama3 8b
基於Meta-Llama-3-8B-Instruct微調的日語優化大語言模型,在多個日語基準測試中表現優異
大型語言模型
Transformers

S
shisa-ai
28
6
Llama 3 8B Japanese Instruct
這是一個基於日語對話數據集微調的Meta-Llama-3-8B-Instruct模型,專注於日語對話任務。
大型語言模型
Transformers 支持多種語言

L
haqishen
33
22
Fugaku LLM 13B
其他
Fugaku-LLM是使用超級計算機'富嶽'從零開始預訓練的日本國產大語言模型,具有高度透明性和安全性,日語表現尤為出色
大型語言模型
Transformers 支持多種語言

F
Fugaku-LLM
25
123
Swallow MS 7b Instruct V0.1
Apache-2.0
基於Mistral-7B-v0.1進行持續預訓練的日語增強大語言模型
大型語言模型
Transformers 支持多種語言

S
tokyotech-llm
48
14
Swallow MS 7b V0.1
Apache-2.0
Swallow-MS-7b-v0.1是基於Mistral-7B-v0.1持續預訓練的日語增強模型,由TokyoTech-LLM開發,在日語任務上表現優異。
大型語言模型
Transformers 支持多種語言

S
tokyotech-llm
736
27
ELYZA Japanese Llama 2 13b Fast Instruct
基於Llama 2的日語優化模型,專為提升日語交互體驗而設計
大型語言模型
Transformers 支持多種語言

E
elyza
1,109
23
ELYZA Japanese Llama 2 13b Instruct
ELYZA-japanese-Llama-2-13b是基於Llama 2進行額外預訓練以擴展日語能力的模型。
大型語言模型
Transformers 支持多種語言

E
elyza
1,022
40
ELYZA Japanese Llama 2 7b Fast Instruct
基於Llama2架構,通過追加預訓練擴展日語能力的語言模型
大型語言模型
Transformers 支持多種語言

E
elyza
1,576
75
ELYZA Japanese Llama 2 7b Instruct
基於Llama2架構,通過追加預訓練擴展日語能力的語言模型
大型語言模型
Transformers 支持多種語言

E
elyza
5,917
67
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98