# 日語指令微調

Openrs3 GRPO Ja
OpenRS3-GRPO-ja是基於SakanaAI/TinySwallow-1.5B-Instruct模型在日語數學指令數據集上微調的版本,採用GRPO方法訓練,專注於數學推理任務。
大型語言模型 Transformers
O
EQUES
25
3
Gemma 2 Baku 2b It
基於Gemma 2 Baku 2B的指令微調模型,優化了指令遵循能力,適用於自然語言處理任務。
大型語言模型 Transformers Japanese
G
rinna
2,555
27
Mistral Nemo Japanese Instruct 2408
Apache-2.0
這是一個基於Mistral-Nemo-Instruct-2407的日語持續預訓練模型,專注於日語文本生成任務。
大型語言模型 Safetensors Supports Multiple Languages
M
cyberagent
1,898
39
Llama 3.1 70B Japanese Instruct 2407
這是一個基於Meta-Llama-3.1-70B-Instruct持續預訓練的日語大語言模型,支持日語和英語。
大型語言模型 Transformers Supports Multiple Languages
L
cyberagent
343
74
Llama 3 8B Instruct Ja
Other
針對Llama 3進行日語化的模型,允許商業用途,支持日語問答和對話
大型語言模型 Transformers Supports Multiple Languages
L
alfredplpl
78
18
Japanese Stablelm Instruct Gamma 7B GGUF
Apache-2.0
Japanese StableLM Instruct Gamma 7B是由Stability AI開發的日語大語言模型,基於Mistral架構,專注於日語指令理解和生成任務。
大型語言模型 Japanese
J
TheBloke
1,583
9
Llm Jp 13b Instruct Full Jaster Dolly Oasst V1.0
Apache-2.0
由日本LLM-jp項目開發的大規模語言模型,支持日語和英語的文本生成任務
大型語言模型 Transformers Supports Multiple Languages
L
llm-jp
750
8
Japanese Stablelm Instruct Alpha 7b
Other
基於70億參數解碼器的日語指令微調語言模型,適用於生成類任務
大型語言模型 Transformers Japanese
J
stabilityai
578
96
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase