E

Excalibur 7b DPO

InferenceIllusionistによって開発
Excalibur-7b-DPOはExcalibur-7bベースモデルを直接選好最適化(DPO)でファインチューニングした大規模言語モデルで、対話品質と視覚アプリケーションシーンのパフォーマンス向上に焦点を当てています。
ダウンロード数 22
リリース時間 : 3/28/2024

モデル概要

このモデルはIntel/orca_dpo_pairsデータセットを使用してDPOファインチューニングを行い、特に視覚アプリケーションシーンにおける回答品質の向上を目指しています。ファインチューニング後のモデルはより対話的で包括的になり、複数のベンチマークテストでパフォーマンスが向上しています。

モデル特徴

DPOファインチューニング最適化
直接選好最適化(DPO)手法でファインチューニングし、モデルの対話品質と回答の包括性を大幅に向上
視覚アプリケーション強化
視覚アプリケーションシーンのパフォーマンスを特別に最適化し、画像理解と説明をサポート
マルチフォーマット対応
ChatMLとAlpacaプロンプト形式をサポートし、様々なアプリケーションシーンに対応
量子化バージョン選択可能
重み付き量子化と静的量子化の2つのバージョンを提供し、異なるハードウェア要件に対応

モデル能力

テキスト生成
視覚シーン理解
マルチターン対話
知識質問応答
推論タスク

使用事例

視覚アプリケーション
画像説明生成
入力画像に基づいて詳細な説明を生成
追加のmmprojファイルサポートが必要
対話システム
インテリジェントアシスタント
より自然で流暢な対話アシスタントを構築
ファインチューニング後に対話品質が大幅に向上
教育アプリケーション
知識質問応答
様々な知識質問に回答
AI2推論チャレンジなどのベンチマークテストで良好なパフォーマンス
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase