B

Beaver 7b V1.0

由PKU-Alignment開發
Beaver是基於Alpaca模型,使用Safe-RLHF技術訓練的聊天助手,專注於大語言模型的安全性研究。
下載量 35
發布時間 : 6/24/2023

模型概述

Beaver是一個基於LLaMA和Alpaca模型的安全對齊語言模型,通過Safe-RLHF技術訓練,旨在提供有用信息的同時避免輸出有害內容。

模型特點

安全對齊
使用Safe-RLHF技術訓練,有效避免輸出有害內容
多版本對比
提供v1.0至v3.0多個版本,展示安全性能的逐步提升
完整訓練體系
包含配套的獎勵模型和成本模型,形成完整的安全訓練框架

模型能力

安全對話生成
有害內容過濾
多輪對話處理

使用案例

AI安全研究
安全對話系統
用於研究如何構建安全的對話AI系統
相比基礎Alpaca模型能顯著減少有害內容輸出
教育應用
安全教育演示
展示安全AI與普通AI在敏感問題上的回答差異
清晰展示安全對齊技術的效果
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase