モデル選定

DPO微調整

# DPO微調整

Llama Poro 2 8B Instruct

Poro 2 8B Instructは、Llama 3.1 8Bアーキテクチャに基づく命令従順型チャットボットモデルで、フィンランド語と英語の対話型AIアプリケーション向けに設計されています。

大規模言語モデル

Transformers 複数言語対応

Llama VARCO 8B Instruct

Llama-VARCO-8B-InstructはLlamaをベースに構築された生成モデルで、追加の学習により、韓国語処理において優れた性能を発揮し、同時に英語能力も維持しています。

大規模言語モデル

Transformers 複数言語対応

L3.1 8B Sunfall Stheno V0.6.1

Sunfallモデルは、Llama-3.1-8B-Stheno-v3.4をベースに開発された自然言語処理モデルで、特定の機能とアプリケーションシーンに適しています。

大規模言語モデル

Tanuki 8x8B Dpo V1.0

Tanuki-8x8Bはゼロから事前学習された大規模言語モデルで、SFTとDPOを通じて対話タスクに対して最適化されています。

大規模言語モデル

Transformers 複数言語対応

Humanish Roleplay Llama 3.1 8B

これはDPO微調整を行ったLlama-3.1モデルで、より「人間らしく」振る舞い、AIアシスタントのような硬い回答を避け、ロールプレイシーンに適しています。

大規模言語モデル

Jamet 8B L3 MK.V Blackroot

Jamet-8B-L3-MK.V-BlackrootはLlama 3ベースのロールプレイおよびストーリーテリングモデルで、繰り返しの最適化を経ており、特にクリエイティブライティングとインタラクティブな対話に適しています。

大規模言語モデル

Flammen21 Mistral 7B

Mistral 7B大規模言語モデルをベースに、事前学習モデルを統合し、Date-DPO-v2データセットで微調整したもので、ロールプレイング、クリエイティブライティング、一般的な知的タスクに長けています。

大規模言語モデル

Blockchainlabs 7B Merged Test2 4 Prune Sft 4bit DPO Orca

これは、プルーニングとDPOトレーニングを行った7Bパラメータ規模の小型LLMで、デバイス端末用途向けに最適化されています。

大規模言語モデル

Transformers 英語

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

大規模言語モデル

Transformers 複数言語対応

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

対話システム

Transformers 英語

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

AIbase

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

© 2025AIbase