P

Prometheus 8x7b V2.0

prometheus-evalによって開発
Prometheus 2はMistral-Instructベースの言語モデルで、細粒度評価と人間フィードバック強化学習(RLHF)の報酬モデルに特化しており、GPT-4評価の代替案として利用可能です。
ダウンロード数 686
リリース時間 : 2/20/2024

モデル概要

このモデルは絶対評価(直接評価)と相対評価(ペアワイズランキング)をサポートし、重み統合技術により性能を向上させます。

モデル特徴

重み統合技術
絶対評価と相対評価を同時にサポートし、各評価形式での性能向上が可能
細粒度評価能力
言語モデルの出力に対して詳細な品質評価とフィードバックが可能
人間フィードバック強化学習
RLHFトレーニングにおける報酬モデルとして使用可能

モデル能力

テキスト生成
品質評価
フィードバック生成
ペアワイズ比較

使用事例

モデル評価
言語モデル出力評価
他の言語モデルが生成したテキストの品質を評価
GPT-4評価の代替案として利用可能
強化学習
RLHF報酬モデル
人間フィードバック強化学習において報酬信号の提供者として機能
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase