B

Beaver 7b V1.0 Cost

Developed by PKU-Alignment
ビーバーコストモデルはPKU-SafeRLHFデータセットで訓練された選好モデルで、安全RLHFアルゴリズムにおいてモデル出力の安全性を評価するために使用されます。
Downloads 3,336
Release Time : 7/10/2023

Model Overview

このモデルは安全RLHFアルゴリズムで効果を発揮し、ビーバーモデルをより安全で無害にするのに役立ちます。Transformerアーキテクチャに基づく自己回帰型言語モデルです。

Model Features

安全強化学習
安全RLHFアルゴリズム専用設計で、モデル出力をより安全で無害な内容にするのに役立ちます
LLaMAアーキテクチャベース
LLaMAとAlpacaモデルのファインチューニングにより、強力な言語理解能力を備えています
安全選好スコアリング
モデル出力の安全性評価とスコアリングが可能です

Model Capabilities

安全選好スコアリング
対話安全性評価
強化学習安全フィードバック

Use Cases

人工知能安全
対話システム安全評価
対話システム出力の安全性を評価し、有害な内容生成を防止します
対話システムの安全性と信頼性を向上させます
RLHFトレーニング
強化学習人間フィードバックトレーニングにおいて安全選好信号を提供します
より安全なAIモデルのトレーニングを支援します
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase