# 日語指令微調

Openrs3 GRPO Ja
OpenRS3-GRPO-ja是基於SakanaAI/TinySwallow-1.5B-Instruct模型在日語數學指令數據集上微調的版本,採用GRPO方法訓練,專注於數學推理任務。
大型語言模型 Transformers
O
EQUES
25
3
Gemma 2 Baku 2b It
基於Gemma 2 Baku 2B的指令微調模型,優化了指令遵循能力,適用於自然語言處理任務。
大型語言模型 Transformers 日語
G
rinna
2,555
27
Mistral Nemo Japanese Instruct 2408
Apache-2.0
這是一個基於Mistral-Nemo-Instruct-2407的日語持續預訓練模型,專注於日語文本生成任務。
大型語言模型 Safetensors 支持多種語言
M
cyberagent
1,898
39
Llama 3.1 70B Japanese Instruct 2407
這是一個基於Meta-Llama-3.1-70B-Instruct持續預訓練的日語大語言模型,支持日語和英語。
大型語言模型 Transformers 支持多種語言
L
cyberagent
343
74
Llama 3 8B Instruct Ja
其他
針對Llama 3進行日語化的模型,允許商業用途,支持日語問答和對話
大型語言模型 Transformers 支持多種語言
L
alfredplpl
78
18
Japanese Stablelm Instruct Gamma 7B GGUF
Apache-2.0
Japanese StableLM Instruct Gamma 7B是由Stability AI開發的日語大語言模型,基於Mistral架構,專注於日語指令理解和生成任務。
大型語言模型 日語
J
TheBloke
1,583
9
Llm Jp 13b Instruct Full Jaster Dolly Oasst V1.0
Apache-2.0
由日本LLM-jp項目開發的大規模語言模型,支持日語和英語的文本生成任務
大型語言模型 Transformers 支持多種語言
L
llm-jp
750
8
Japanese Stablelm Instruct Alpha 7b
其他
基於70億參數解碼器的日語指令微調語言模型,適用於生成類任務
大型語言模型 Transformers 日語
J
stabilityai
578
96
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase