B

Beaver 7b V1.0 Cost

PKU-Alignmentによって開発
ビーバーコストモデルはPKU-SafeRLHFデータセットで訓練された選好モデルで、安全RLHFアルゴリズムにおいてモデル出力の安全性を評価するために使用されます。
ダウンロード数 3,336
リリース時間 : 7/10/2023

モデル概要

このモデルは安全RLHFアルゴリズムで効果を発揮し、ビーバーモデルをより安全で無害にするのに役立ちます。Transformerアーキテクチャに基づく自己回帰型言語モデルです。

モデル特徴

安全強化学習
安全RLHFアルゴリズム専用設計で、モデル出力をより安全で無害な内容にするのに役立ちます
LLaMAアーキテクチャベース
LLaMAとAlpacaモデルのファインチューニングにより、強力な言語理解能力を備えています
安全選好スコアリング
モデル出力の安全性評価とスコアリングが可能です

モデル能力

安全選好スコアリング
対話安全性評価
強化学習安全フィードバック

使用事例

人工知能安全
対話システム安全評価
対話システム出力の安全性を評価し、有害な内容生成を防止します
対話システムの安全性と信頼性を向上させます
RLHFトレーニング
強化学習人間フィードバックトレーニングにおいて安全選好信号を提供します
より安全なAIモデルのトレーニングを支援します
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase