Openrs3 GRPO Ja
OpenRS3-GRPO-ja是基於SakanaAI/TinySwallow-1.5B-Instruct模型在日語數學指令數據集上微調的版本,採用GRPO方法訓練,專注於數學推理任務。
大型語言模型
Transformers

O
EQUES
25
3
Gemma 2 Baku 2b It
基於Gemma 2 Baku 2B的指令微調模型,優化了指令遵循能力,適用於自然語言處理任務。
大型語言模型
Transformers 日語

G
rinna
2,555
27
Mistral Nemo Japanese Instruct 2408
Apache-2.0
這是一個基於Mistral-Nemo-Instruct-2407的日語持續預訓練模型,專注於日語文本生成任務。
大型語言模型
Safetensors 支持多種語言
M
cyberagent
1,898
39
Llama 3.1 70B Japanese Instruct 2407
這是一個基於Meta-Llama-3.1-70B-Instruct持續預訓練的日語大語言模型,支持日語和英語。
大型語言模型
Transformers 支持多種語言

L
cyberagent
343
74
Llama 3 8B Instruct Ja
其他
針對Llama 3進行日語化的模型,允許商業用途,支持日語問答和對話
大型語言模型
Transformers 支持多種語言

L
alfredplpl
78
18
Japanese Stablelm Instruct Gamma 7B GGUF
Apache-2.0
Japanese StableLM Instruct Gamma 7B是由Stability AI開發的日語大語言模型,基於Mistral架構,專注於日語指令理解和生成任務。
大型語言模型 日語
J
TheBloke
1,583
9
Llm Jp 13b Instruct Full Jaster Dolly Oasst V1.0
Apache-2.0
由日本LLM-jp項目開發的大規模語言模型,支持日語和英語的文本生成任務
大型語言模型
Transformers 支持多種語言

L
llm-jp
750
8
Japanese Stablelm Instruct Alpha 7b
其他
基於70億參數解碼器的日語指令微調語言模型,適用於生成類任務
大型語言模型
Transformers 日語

J
stabilityai
578
96
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98