モデル選定

DPOファインチューニング

# DPOファインチューニング

L3.3 GeneticLemonade Unleashed V3 70B

これはLlama 3.3ベースの700億パラメータ大規模言語モデルで、SFT+DPOファインチューニングを経ており、キャラクター駆動の対話とクリエイティブコンテンツ生成に特化しています

大規模言語モデル

EchoLLaMAはマルチモーダルAIシステムで、3D視覚データを自然な音声記述に変換でき、音声入力による対話型インタラクションもサポートします。

画像生成テキスト

Qwen2.5 14B Dpo It Ties

Qwen2.5-14BモデルをベースにTIES手法で融合した強化版で、命令追従と対話最適化に特化

大規模言語モデル

mergekit-community

Chocolatine 2 14B Instruct V2.0.3

Chocolatine-2-14B-Instruct-v2.0.3 は Qwen-2.5-14B アーキテクチャに基づく大規模言語モデルで、DPOファインチューニングを施されており、フランス語と英語のタスクに特化しており、フランス語LLMランキングで優れた成績を収めています。

大規模言語モデル

Transformers 複数言語対応

Gemma 2 9b Neogenesis Ita

VAGOsolutions/SauerkrautLM-gemma-2-9b-itをファインチューニングしたバージョンで、イタリア語のパフォーマンスを最適化し、8kのコンテキスト長をサポートします。

大規模言語モデル

Transformers 複数言語対応

Tanuki 8B Dpo V1.0

Tanuki-8Bは8Bパラメータの日本語大規模言語モデルで、SFTとDPOによって会話タスク向けに最適化されており、GENIAC松尾研究室によって開発されました

大規模言語モデル

Transformers 複数言語対応

Ko Gemma 2 9b It

Ko-Gemma-2-9B-ITはGemmaモデルシリーズの韓国語会話モデルで、google/gemma-2-9b-itを基に教師あり微調整（SFT）と直接選好最適化（DPO）トレーニングを行い、韓国語テキスト生成タスクに特化して最適化されています。

大規模言語モデル

Transformers 韓国語

Llama 3 Bophades V3 8B

Llama-3-8bを基に構築されたDPOファインチューニングモデルで、真実性と数学的推論能力の向上に焦点を当てています

大規模言語モデル

Calme 2.3 Llama3 70b

Meta-Llama-3-70B-InstructモデルをDPOファインチューニングした大規模言語モデルで、複数のベンチマークテストで優れた性能を発揮

大規模言語モデル

Transformers 英語

Neural-4-QA-7bは、複数の7Bパラメータ規模モデルを統合した大規模言語モデルで、質問応答タスクに特化しており、DARE-TIES統合手法を用いて性能を最適化しています。

大規模言語モデル

Noro Hermes 3x7B

Noro-Hermes-3x7Bは、LazyMergeKitツールを使用して構築された混合専門家モデル（MoE）で、3つの7BパラメータのMistralバリエーションモデルを融合し、インテリジェントアシスタント、クリエイティブなロールプレイ、一般的なタスク処理能力を備えています。

大規模言語モデル

Starchat2 15b V0.1

StarChat2はStarCoder2をファインチューニングした160億パラメータのプログラミングアシスタントモデルで、対話とコード生成タスクに優れています

大規模言語モデル

Zephyr 7b Gemma V0.1

Zephyr 7B Gemmaはgoogle/gemma-7bをファインチューニングした言語モデルで、公開合成データセットで直接選好最適化(DPO)を使用して訓練され、有用なアシスタントとして設計されています。

大規模言語モデル

EEVE-Korean-Instruct-10.8B-v1.0を基にした韓国語コマンド最適化モデル、直接選好最適化(DPO)手法でトレーニング

大規模言語モデル

ENERGY-DRINK-LOVE

Minueza 32M Chat

Minueza-32M-Chatは3200万パラメータを持つチャットモデルで、Felladrin/Minueza-32M-Baseを基に教師ありファインチューニング(SFT)と直接選好最適化(DPO)で訓練されています。

大規模言語モデル

Transformers 英語

Olmo 7B Instruct

OLMo 7B InstructはDolmaデータセットでトレーニングされたオープン言語モデルで、SFTとDPOで最適化され、質問応答タスク向けに設計されています。

大規模言語モデル

Transformers 英語

EEVE Korean Instruct 10.8B V1.0

SOLAR-10.7B-v1.0を基にした韓国語語彙拡張版、DPOファインチューニング済み大規模言語モデル

大規模言語モデル

Polka 1.1b Chat

ローカル実行専用に設計された初のポーランド語会話アシスタントモデル。TinyLlama-1.1Bをベースにポーランド語トークナイザーを拡張し、事前学習とDPO最適化を実施

大規模言語モデル

Transformers その他

Neuralhermes 2.5 Mistral 7B

NeuralHermesはOpenHermes-2.5-Mistral-7Bモデルを基に、直接選好最適化(DPO)でさらにファインチューニングされた大規模言語モデルで、多くのベンチマークテストで優れた性能を発揮します。

大規模言語モデル

Transformers 英語

Causallm 14B DPO Alpha GGUF

14Bパラメータの因果言語モデルをベースに、DPO最適化トレーニングを経て、中英文テキスト生成タスクをサポート

大規模言語モデル複数言語対応

Mini Synatra 7b 02

Mini_synatra_7b_02はMinirecord社がmaywell/Synatra-7B-v0.3-dpoモデルを基にファインチューニングした大規模言語モデルで、テキスト生成タスクに特化しています。

大規模言語モデル

14Bパラメータ規模の因果言語モデル、Meta LLaMA 2アーキテクチャと完全互換、複数のベンチマークテストで70B以下のモデルを超越

大規模言語モデル

Transformers 複数言語対応

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

大規模言語モデル

Transformers 複数言語対応

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

対話システム

Transformers 英語

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

AIbase

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

© 2025AIbase