P

Prometheus 13b V1.0

prometheus-evalによって開発
プロメテウスはLlama-2-Chatをファインチューニングした評価型言語モデルで、カスタム基準に基づくテキスト品質評価に優れ、GPT-4評価の経済的代替案として利用可能です。
ダウンロード数 1,726
リリース時間 : 10/12/2023

モデル概要

このモデルは10万件のフィードバックデータで微調整されており、参考回答と評価基準に基づいてテキスト回答を細かく評価でき、その性能はGPT-4に匹敵します。同時にRLHFの報酬モデルとしても機能します。

モデル特徴

細粒度評価能力
参考回答とカスタム評価基準により、汎用モデルよりも正確なテキスト評価を実現
コスト効率の高い代替案
評価性能はGPT-3.5-Turboを上回り、GPT-4と同等ながらコストが低い
多基準適応性
子供向けの読みやすさ、文化的感受性、創造性などカスタム評価基準に対応

モデル能力

テキスト品質評価
フィードバック生成
報酬モデリング
多次元評価

使用事例

モデル評価
大規模言語モデル出力評価
特定基準に基づき異なるLLMが生成したテキストの品質を評価
複数のベンチマークテストでGPT-4評価結果と高い一致率を示した
強化学習
RLHF報酬モデル
人間フィードバック強化学習のための自動化された報酬信号を提供
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase