# DPOファインチューニング最適化

Llama 3 Gutenberg 8B
その他
Llama-3-8bベースのファインチューニングモデルで、Gutenberg DPOデータセットを使用して最適化されており、テキスト生成タスクに適しています。
大規模言語モデル Transformers
L
nbeerbower
18
9
Excalibur 7b DPO
Apache-2.0
Excalibur-7b-DPOはExcalibur-7bベースモデルを直接選好最適化(DPO)でファインチューニングした大規模言語モデルで、対話品質と視覚アプリケーションシーンのパフォーマンス向上に焦点を当てています。
大規模言語モデル Transformers
E
InferenceIllusionist
22
8
Neuralbeagle14 7B 8.0bpw H8 Exl2
Apache-2.0
NeuralBeagle14-7BはBeagle14-7Bモデルを基に、DPO手法でファインチューニングされた7Bパラメータの大規模言語モデルで、7Bパラメータクラスで優れた性能を発揮します。
大規模言語モデル Transformers
N
LoneStriker
111
5
Tinymistral 248M Chat V4
Apache-2.0
TinyMistral-248M-ChatはTinyMistral-248Mをファインチューニングした対話モデルで、マルチターン対話をサポートし、様々な対話シナリオに適しています。
大規模言語モデル Transformers 英語
T
Felladrin
516
29
Tinymistral 248M Chat V3
Apache-2.0
TinyMistral-248M-ChatはTinyMistral-248Mをベースにしたチャットモデルで、複数のデータセットでトレーニングされ最適化されており、様々な対話タスクに適しています。
大規模言語モデル Transformers 英語
T
Felladrin
456
28
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase