B

Beaver 7b V1.0

PKU-Alignmentによって開発
BeaverはAlpacaモデルを基に、Safe-RLHF技術を使用して訓練されたチャットアシスタントで、大規模言語モデルの安全性研究に焦点を当てています。
ダウンロード数 35
リリース時間 : 6/24/2023

モデル概要

BeaverはLLaMAとAlpacaモデルを基にした安全アライメント言語モデルで、Safe-RLHF技術により訓練され、有用な情報を提供すると同時に有害なコンテンツの出力を回避することを目的としています。

モデル特徴

安全アライメント
Safe-RLHF技術を使用して訓練され、有害なコンテンツの出力を効果的に回避
マルチバージョン比較
v1.0からv3.0までの複数のバージョンを提供し、安全性性能の段階的な向上を示す
完全な訓練体系
対応する報酬モデルとコストモデルを含み、完全な安全訓練フレームワークを形成

モデル能力

安全対話生成
有害コンテンツフィルタリング
マルチターン対話処理

使用事例

AI安全研究
安全対話システム
安全な対話AIシステムの構築方法を研究するために使用
基本Alpacaモデルと比較して有害なコンテンツの出力を大幅に削減
教育応用
安全教育デモンストレーション
安全AIと通常のAIが敏感な問題に対してどのように異なる回答をするかを示す
安全アライメント技術の効果を明確に示す
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase