# DPO微調整

Llama Poro 2 8B Instruct
Poro 2 8B Instructは、Llama 3.1 8Bアーキテクチャに基づく命令従順型チャットボットモデルで、フィンランド語と英語の対話型AIアプリケーション向けに設計されています。
大規模言語モデル Transformers 複数言語対応
L
LumiOpen
148
5
Llama VARCO 8B Instruct
Llama-VARCO-8B-InstructはLlamaをベースに構築された生成モデルで、追加の学習により、韓国語処理において優れた性能を発揮し、同時に英語能力も維持しています。
大規模言語モデル Transformers 複数言語対応
L
NCSOFT
2,981
74
L3.1 8B Sunfall Stheno V0.6.1
Sunfallモデルは、Llama-3.1-8B-Stheno-v3.4をベースに開発された自然言語処理モデルで、特定の機能とアプリケーションシーンに適しています。
大規模言語モデル Transformers
L
crestf411
183
4
Tanuki 8x8B Dpo V1.0
Apache-2.0
Tanuki-8x8Bはゼロから事前学習された大規模言語モデルで、SFTとDPOを通じて対話タスクに対して最適化されています。
大規模言語モデル Transformers 複数言語対応
T
weblab-GENIAC
217
38
Humanish Roleplay Llama 3.1 8B
Apache-2.0
これはDPO微調整を行ったLlama-3.1モデルで、より「人間らしく」振る舞い、AIアシスタントのような硬い回答を避け、ロールプレイシーンに適しています。
大規模言語モデル Transformers
H
vicgalle
1,880
14
Jamet 8B L3 MK.V Blackroot
Jamet-8B-L3-MK.V-BlackrootはLlama 3ベースのロールプレイおよびストーリーテリングモデルで、繰り返しの最適化を経ており、特にクリエイティブライティングとインタラクティブな対話に適しています。
大規模言語モデル Transformers
J
Hastagaras
32
21
Flammen21 Mistral 7B
Apache-2.0
Mistral 7B大規模言語モデルをベースに、事前学習モデルを統合し、Date-DPO-v2データセットで微調整したもので、ロールプレイング、クリエイティブライティング、一般的な知的タスクに長けています。
大規模言語モデル Transformers
F
flammenai
23
1
Blockchainlabs 7B Merged Test2 4 Prune Sft 4bit DPO Orca
これは、プルーニングとDPOトレーニングを行った7Bパラメータ規模の小型LLMで、デバイス端末用途向けに最適化されています。
大規模言語モデル Transformers 英語
B
alnrg2arg
18
2
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase